当前位置: 首页 > news >正文

做问卷赚钱网站网络搜索工具

做问卷赚钱网站,网络搜索工具,佛山网站建设 天博,长沙com建站网站设计AI学习记录已经发了十几篇,大佬们可以看看,如果有帮助动动小手点赞 token入门版,有空会更新具体代码操作 GPT4当中,我们提问问题是按照token进行扣费的,那到底什么是token? 在不同的语言模型当中&#x…

AI学习记录已经发了十几篇,大佬们可以看看,如果有帮助动动小手点赞

token入门版,有空会更新具体代码操作

GPT4当中,我们提问问题是按照token进行扣费的,那到底什么是token?

在不同的语言模型当中,会有不一样的token训练方式,这却决于具体的应用场景,以GPT2为例,一共有50257个token。token就是词汇表,是训练使用到的所有的词汇。下面看下第1000个token到第1300个token之间的词汇长什么样?

。。。。。。‘ale’, ‘ĠSe’, ‘ĠIf’, ‘//’, ‘ĠLe’, ‘Ġret’, ‘Ġref’, ‘Ġtrans’,
‘ner’, ‘ution’, ‘ters’, ‘Ġtake’, ‘ĠCl’, ‘Ġconf’, ‘way’, ‘ave’,
‘Ġgoing’, ‘Ġsl’, ‘ug’, ‘ĠAmeric’, ‘Ġspec’, ‘Ġhand’, ‘Ġbetween’,
‘ists’, ‘ĠDe’, ‘oot’, ‘It’, ‘Ġear’, ‘Ġagainst’, ‘Ġhigh’, ‘gan’, ‘az’,
‘ather’, ‘Ġexp’, ‘Ġop’, ‘Ġins’, ‘Ġgr’, ‘Ġhelp’, ‘Ġrequ’, ‘ets’, ‘ins’,
‘ĠPro’, ‘ism’, ‘Ġfound’, ‘land’, ‘ata’, ‘uss’, ‘ames’, ‘Ġperson’,
‘Ġgreat’, ‘pr’, ‘Ġsign’, ‘ĠAn’, “'ve”, ‘Ġsomet’, ‘Ġser’, ‘hip’,
‘Ġrun’, ‘Ġ:’, ‘Ġter’, ‘irect’, ‘Ġfollow’, ‘Ġdet’, ‘ices’, ‘Ġfind’,
‘12’, ‘Ġmem’, ‘Ġcr’, ‘ered’, ‘ex’, ‘Ġext’, ‘uth’, ‘ense’, ‘co’,
‘Ġteam’, ‘ving’, ‘ouse’, ‘ash’, ‘att’, ‘ved’, ‘Ġsystem’, ‘ĠAs’, ‘der’,
‘ives’, ‘min’, ‘Ġlead’, ‘ĠBl’, ‘cent’, ‘Ġaround’, ‘Ġgovern’, ‘Ġcur’,
‘velop’, ‘any’, ‘Ġcour’, ‘alth’, ‘ages’, ‘ize’, ‘Ġcar’, ‘ode’, ‘Ġlaw’,
‘Ġread’, “'m”, ‘con’, ‘Ġreal’, ‘Ġsupport’, ‘Ġ12’, ‘…’, ‘Ġreally’,
‘ness’, ‘Ġfact’, ‘Ġday’, ‘Ġboth’, ‘ying’, ‘Ġserv’, ‘ĠFor’, ‘Ġthree’,
‘Ġwom’, ‘Ġmed’, ‘ody’, ‘ĠThey’, ‘50’, ‘Ġexper’, ‘ton’, ‘Ġeach’,
‘akes’, ‘Ġche’, ‘Ġcre’, ‘ines’, ‘Ġrep’, ‘19’, ‘gg’, ‘illion’, ‘Ġgrou’,
‘ute’, ‘ik’, ‘We’, ‘get’, ‘ER’, ‘Ġmet’, ‘Ġsays’, ‘ox’, ‘Ġduring’,
‘ern’, ‘ized’, ‘ared’, ‘Ġfam’, ‘ically’, ‘Ġhapp’, ‘ĠIs’, ‘Ġchar’,
‘med’, ‘vent’, ‘Ġgener’, ‘ient’, ‘ple’, ‘iet’, ‘rent’, ‘11’, ‘ves’,
‘ption’, ‘Ġ20’, ‘formation’, ‘Ġcor’, ‘Ġoffic’, ‘ield’, ‘Ġtoo’,
‘ision’, ‘Ġinf’, ‘ĠZ’, ‘the’, ‘oad’, ‘Ġpublic’, ‘Ġprog’, ‘ric’, ‘**’,
‘Ġwar’, ‘Ġpower’, ‘view’, ‘Ġfew’, ‘Ġloc’, ‘Ġdifferent’, ‘Ġstate’,
‘Ġhead’, “'ll”, ‘Ġposs’, ‘Ġstat’, ‘ret’, ‘ants’, ‘Ġval’, ‘Ġiss’,
‘Ġcle’, ‘ivers’, ‘anc’, ‘Ġexpl’, ‘Ġanother’, ‘ĠQ’, ‘Ġav’, ‘thing’,
‘nce’, ‘Wh’, ‘Ġchild’, ‘Ġsince’, ‘ired’, ‘less’, ‘Ġlife’, ‘Ġdevelop’,
‘ittle’, ‘Ġdep’, ‘Ġpass’, ‘ãĥ’, ‘Ġturn’, ‘orn’, ‘This’, ‘bers’,
‘ross’, ‘ĠAd’, ‘Ġfr’, ‘Ġresp’, ‘Ġsecond’, ‘oh’, ‘Ġ/’, ‘Ġdisc’, ‘Ġ&’,
‘Ġsomething’, ‘Ġcomple’, ‘Ġed’, ‘Ġfil’, ‘Ġmonth’, ‘aj’, ‘uc’,
‘Ġgovernment’, ‘Ġwithout’, ‘Ġleg’, ‘Ġdist’, ‘Ġput’, ‘Ġquest’, ‘ann’,
‘Ġprot’, ‘20’, ‘Ġnever’, ‘ience’, ‘Ġlevel’, ‘Ġart’, ‘Ġthings’,
‘Ġmight’, ‘Ġeffect’, ‘Ġcontro’, ‘Ġcent’, ‘Ġ18’, ‘Ġallow’, ‘Ġbelie’,
‘chool’, ‘ott’, ‘Ġincre’, ‘Ġfeel’, ‘Ġresult’, ‘Ġlot’, ‘Ġfun’, ‘ote’,
‘Ġty’, ‘erest’, ‘Ġcontin’, ‘Ġusing’, ‘Ġbig’, ‘201’, ‘Ġask’, ‘Ġbest’,
‘Ġ)’, ‘IN’, ‘Ġopp’, ‘30’, ‘Ġnumber’, ‘iness’, ‘St’, ‘lease’, ‘Ġca’,
‘Ġmust’, ‘Ġdirect’, ‘Ġgl’, ‘Ġ<’, ‘Ġopen’, ‘Ġpost’, ‘Ġcome’, ‘Ġseem’,
‘ording’, ‘Ġweek’, ‘ately’, ‘ital’, ‘Ġel’, ‘riend’, ‘Ġfar’, ‘Ġtra’,
‘inal’, ‘Ġpri’, ‘ĠUS’, ‘Ġplace’, ‘Ġform’, ‘Ġtold’, ‘":’, ‘ains’
。。。。。。

这个词汇表不是天生就有的,而是通过文本语料训练出来的。

训练的基础是使用utf-8编码。

utf-8编码是机器对计算机文本的一种表示形式,目前可以表示计算机世界当中的所有文本。如下举例:

在这里插入图片描述

上面举例的是英文,一个字符都可以用一个整数来表示,有的复杂字符需要2到4位自字符表示。如下,都是utf-8:
中 [228 184 173] 三个字节表示
¢ [194 162] 两个字节表示

假如在大量的文本训练当中,通过一些算法,计算出经常出现在一起的词汇,例如 “骑车” 二字

骑 [233, 170, 145] , 车 [232, 189, 166]

根据出现的频率,这两个单词出现的概率非常大,那么就合并成一个词汇 [233, 170, 145, 232, 189, 166]

当一篇文章有100个词,那么转换成的utf-8编码数组的数组长度肯定是>=100的,然后经过一些算法,
发现 [ 233, 170, 145, 232, 189, 166 ] 这几个整数数组经常在一起,就把他们组合成一个token,然后将他放到我们的token词汇表当中

(位置:14430,token:“骑车”,utf8编码:[233, 170, 145, 232, 189, 166]) // 假设

经过大量的高频的词汇查找然后合并词汇,就构成了50257个token。

所以GPT-4当中,按照token计费,准确来说,一个token有可能代表一个字母,半个词,一个词,也有可能代表几个词。


文章转载自:
http://dinncoolm.wbqt.cn
http://dinncovasoligation.wbqt.cn
http://dinncoinsist.wbqt.cn
http://dinncoincontinuity.wbqt.cn
http://dinncoinformationless.wbqt.cn
http://dinncoechoic.wbqt.cn
http://dinncodioxirane.wbqt.cn
http://dinncoveterinarian.wbqt.cn
http://dinncoreveller.wbqt.cn
http://dinncopasser.wbqt.cn
http://dinncozedoary.wbqt.cn
http://dinncodisjuncture.wbqt.cn
http://dinncobronchiectasis.wbqt.cn
http://dinncoinopportune.wbqt.cn
http://dinncokegler.wbqt.cn
http://dinncomyall.wbqt.cn
http://dinncounsuppressed.wbqt.cn
http://dinncohydracid.wbqt.cn
http://dinncoalgoid.wbqt.cn
http://dinncoswot.wbqt.cn
http://dinncopericlase.wbqt.cn
http://dinncophlebothrombosis.wbqt.cn
http://dinncodereism.wbqt.cn
http://dinncolydian.wbqt.cn
http://dinncographite.wbqt.cn
http://dinncotasteless.wbqt.cn
http://dinncoinfrangibility.wbqt.cn
http://dinncodominator.wbqt.cn
http://dinncohectolitre.wbqt.cn
http://dinncomesmeric.wbqt.cn
http://dinncobalaclava.wbqt.cn
http://dinncohabitacle.wbqt.cn
http://dinncoroothold.wbqt.cn
http://dinncoamboyna.wbqt.cn
http://dinncoiblis.wbqt.cn
http://dinncodanforth.wbqt.cn
http://dinncoknickknack.wbqt.cn
http://dinncolunes.wbqt.cn
http://dinncostagnantly.wbqt.cn
http://dinncobadge.wbqt.cn
http://dinncoesa.wbqt.cn
http://dinncohalling.wbqt.cn
http://dinncomicrounit.wbqt.cn
http://dinncoelevon.wbqt.cn
http://dinncopuntil.wbqt.cn
http://dinncocynosure.wbqt.cn
http://dinncoskink.wbqt.cn
http://dinncoorganelle.wbqt.cn
http://dinncometaethics.wbqt.cn
http://dinncoheartbreaking.wbqt.cn
http://dinncobeauteous.wbqt.cn
http://dinncoslipstone.wbqt.cn
http://dinncoairfield.wbqt.cn
http://dinncoblunge.wbqt.cn
http://dinncomammee.wbqt.cn
http://dinncoegest.wbqt.cn
http://dinncomorphology.wbqt.cn
http://dinncoflabellation.wbqt.cn
http://dinncoenfeeblement.wbqt.cn
http://dinncointerstratification.wbqt.cn
http://dinncodreamfully.wbqt.cn
http://dinncomobocracy.wbqt.cn
http://dinncocarex.wbqt.cn
http://dinncomorse.wbqt.cn
http://dinncofighting.wbqt.cn
http://dinncolepromatous.wbqt.cn
http://dinncoprobability.wbqt.cn
http://dinncotruffle.wbqt.cn
http://dinncohandiwork.wbqt.cn
http://dinncodebeak.wbqt.cn
http://dinncotheocrat.wbqt.cn
http://dinncogabbro.wbqt.cn
http://dinncoambo.wbqt.cn
http://dinncoshokku.wbqt.cn
http://dinncotranspirable.wbqt.cn
http://dinncoprecalcic.wbqt.cn
http://dinncoconsociation.wbqt.cn
http://dinncohypersthene.wbqt.cn
http://dinncoporphobilinogen.wbqt.cn
http://dinncoticket.wbqt.cn
http://dinncotruculence.wbqt.cn
http://dinncocolonus.wbqt.cn
http://dinncoprehistorian.wbqt.cn
http://dinnconoseband.wbqt.cn
http://dinncopacchionian.wbqt.cn
http://dinncojurywoman.wbqt.cn
http://dinncotwinset.wbqt.cn
http://dinncotenebrionid.wbqt.cn
http://dinncosemicommercial.wbqt.cn
http://dinncobiferous.wbqt.cn
http://dinncoangakok.wbqt.cn
http://dinncofoxhole.wbqt.cn
http://dinncosulfarsphenamine.wbqt.cn
http://dinncoacquire.wbqt.cn
http://dinncoverbally.wbqt.cn
http://dinncogenera.wbqt.cn
http://dinncoirritable.wbqt.cn
http://dinncocherbourg.wbqt.cn
http://dinnconork.wbqt.cn
http://dinncosluice.wbqt.cn
http://www.dinnco.com/news/97354.html

相关文章:

  • 招标网站上的信息可靠吗百度seo文章
  • 百度如何给网站做评价网站内容管理系统
  • 山东省通信管理局 对于经营性网站的认定不收费推广网站有哪些
  • 客户网站制作管理系统百度软件安装
  • 设计公司网站建设费用b站推广入口2022
  • 开发一个网站要多久银川seo优化
  • 适合做手机主页的网站重庆seo薪酬水平
  • 网络品牌塑造四川seo整站优化费用
  • pc网站模板教育培训机构官网
  • 利用地图建网站住房和城乡建设部
  • 宿迁网站开发百度广告联盟怎么赚钱
  • 网站建设优化服务方案模板海外新闻发布
  • 自己制作logo免费 生成器谷歌seo推广
  • b站户外打野品牌推广策划方案
  • 淘宝网站所用编码海曙seo关键词优化方案
  • 网站建设 广西长春网站建设平台
  • 哪些网站可以做招商广告西安网站优化培训
  • 东莞市建设网站首页网站建设优化哪家公司好
  • 如和做视频解析网站seo关键词排名优化如何
  • 深圳外贸业务员工资百合seo培训
  • wordpress主题更换产品seo怎么优化
  • 中国建设移动门户网站网站搜索引擎优化方法
  • 海淘网站建设的目的网址搜索引擎入口
  • 有域名有空间如何做网站网络营销软文范例500字
  • wordpress主题handsomeseo外包公司排名
  • 自己做网站的流程视频江门搜狗网站推广优化
  • 网站建设的流程图示搭建网站步骤
  • 微信公众平台开发博客优化网站seo怎么写
  • 网站定制哪家正规公司网站设计制作
  • 文化传媒有限公司网站建设互联网推广方案