当前位置:   article > 正文

从零实现诗词GPT大模型:GPT是怎么生成内容的?

从零实现诗词GPT大模型:GPT是怎么生成内容的?

专栏规划: https://qibin.blog.csdn.net/article/details/137728228

再开始编写GPT之前,我们得对GPT是怎么生成内容的有一个大致的了解。目前的神经网络我们大多都可以看成是一个黑盒,即我们把数据输送给网络后,网络给我我们输出,我们可以不用关心这个黑盒里到底是怎么实现的,但是我们的目标是从零写一个类GPT模型,所以这里我们先对GPT生成内容的过程做一个大致的介绍。

一、GPT的输入

首先,神经网络是不可以把类似过年好这样一句话直接输入到网络中的,而是需要对一句话进行编码变成数字后再输入网络,GPT是使用了一种叫做bpe的算法将文字映射成数字的,这里我们不去讲bpe是怎么实现的,我们可以使用openai提供的tiktoken库进行文字编码,感兴趣的可以去github上查看tiktoken的源码:https://github.com/openai/tiktoken

首先,我们安装tiktoken

pip3 install -i -i https
    声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/AllinToyou/article/detail/431877
    推荐阅读
    相关标签
      

    闽ICP备14008679号