当前位置: 首页 > news >正文

国内手机网站建设网站seo怎么做

国内手机网站建设,网站seo怎么做,做一款网站注意啥,注册公司代理记账行业🍎个人主页:小嗷犬的个人主页 🍊个人网站:小嗷犬的技术小站 🥭个人信条:为天地立心,为生民立命,为往圣继绝学,为万世开太平。 基本信息 标题: The Power of Scale for P…

🍎个人主页:小嗷犬的个人主页
🍊个人网站:小嗷犬的技术小站
🥭个人信条:为天地立心,为生民立命,为往圣继绝学,为万世开太平。


基本信息

标题: The Power of Scale for Parameter-Efficient Prompt Tuning
作者: Brian Lester, Rami Al-Rfou, Noah Constant
发表: EMNLP 2021
arXiv: https://arxiv.org/abs/2104.08691

基本信息

摘要

在这项工作中,我们探讨了“prompt tuning”,这是一种简单而有效的机制,用于学习“soft prompt”以条件化冻结的语言模型执行特定下游任务。

与GPT-3使用的离散文本提示不同,soft prompt是通过反向传播学习的,并且可以调整以包含来自任意数量token示例的信号。

我们端到端的学习方法在少样本学习方面优于GPT-3。

更令人惊讶的是,通过使用T5在模型大小上的消融实验,我们表明提示微调在规模上变得更加具有竞争力:当模型超过数十亿参数时,我们的方法缩小了差距并匹配了模型微调(所有模型权重都进行调整)的强大性能。

这一发现尤其相关,因为大型模型成本高昂且难以共享和部署,而能够重复使用一个冻结模型执行多个下游任务可以减轻这一负担。

我们的方法可以看作是Li和Liang最近提出的“prefix tuning”的简化,我们提供了与这一方法和其他类似方法的比较。

最后,我们表明,使用soft prompt条件化冻结模型可以带来在领域迁移中的鲁棒性优势,并使“prompt ensembling”变得高效。我们发布了代码和模型检查点以重现我们的实验。

Standard model tuning of T5 achieves strong performance, but requires storing separate copies of the model for each end task

prompt tuning、全量微调、使用GPT-3生成提示词三种方法之间的比较。

主要贡献

  1. 提出了prompt tuning,并展示了其在大型语言模型调整机制中的竞争力。
  2. 对许多设计选择进行了消融,并展示质量与鲁棒性随规模提升而提高。
  3. 展示了prompt tuning优于全量微调在领域迁移问题上的表现。
  4. 提出了“prompt ensembling”并展示其有效性。

Prompt Tuning

Model tuning requires making a taskspecific copy of the entire pre-trained model for each downstream task and inference must be performed in separate batches

prompt tuning只需要为每个下游任务训练一个soft prompt,而全量微调需要训练整个模型。

给定一系列 n n n 个token, { x 1 , x 2 , … , x n } \{x_1, x_2, \ldots, x_n\} {x1,x2,,xn},T5 首先做的是嵌入这些token,形成一个矩阵 X e ∈ R n × e X_e \in \mathbb{R}^{n \times e} XeRn×e,其中 e e e 是嵌入空间的维度。soft prompt被表示为一个参数 P e ∈ R p × e P_e \in \mathbb{R}^{p \times e} PeRp×e,其中 p p p 是prompt的长度。然后,soft prompt被连接到嵌入的输入上,形成一个单一的矩阵 [ P e ; X e ] ∈ R ( p + n ) × e [P_e; X_e] \in \mathbb{R}^{(p+n) \times e} [Pe;Xe]R(p+n)×e,然后像往常一样通过编码器-解码器。训练模型以最大化 Y Y Y 的概率,但只有prompt参数 P e P_e Pe 被更新。

Prompt Ensemble

对一个下游任务训练多个Prompt,然后集成多个Prompt而不是多个模型。

实验

Ablations of various hyperparameters on prompt tuning performance (mean and stddev across 3 runs)

各种超参数对prompt tuning性能的影响。

Parameter usage of various adaptation techniques, fixing architecture to T5 1.1 and prompt/prefix length to 1–100 tokens (bands show mean and stddev)

与其他相似方法的比较。在具有可学习参数的方法中,提示调整是最参数高效的,对于超过十亿参数的模型,只需要不到0.01%的任务特定参数。

F1 mean and stddev for models trained on SQuAD and evaluated on out-of-domain datasets from the MRQA 2019 shared task

Mean and stddev of zero-shot domain transfer between two paraphrase detection tasks

领域迁移问题上的表现。

Performance of a five-prompt ensemble built from a single frozen T5-XXL model exceeds both the average and the best among the five prompts

prompt ensemble与prompt平均性能以及单个最好性能的比较。

总结

在这篇论文中,我们展示了prompt tuning是一种将冻结预训练语言模型适应下游任务的竞争性技术。

在流行的SuperGLUE基准上,其任务性能与传统模型调整相当,随着模型规模的增加,差距逐渐消失。

在零样本领域迁移中,我们发现prompt tuning导致了更好的泛化。这很可能表明,冻结通用语言理解参数并将下游学习限制在轻量级参数足迹内,有助于避免对特定领域的过度拟合。

除了任务质量指标之外,我们还讨论了转向冻结预训练模型在存储和服务器成本方面的吸引力。这一举措既实现了高效的多任务服务,也实现了高效的高性能提示集成。

展望未来,我们认为将任务定义参数与通用语言模型参数区分开来是一个令人兴奋的步骤,它为新的研究开辟了许多途径。


文章转载自:
http://dinncodissepiment.tqpr.cn
http://dinncohomeowner.tqpr.cn
http://dinncosentimo.tqpr.cn
http://dinncomagi.tqpr.cn
http://dinncoswalk.tqpr.cn
http://dinncotwiggy.tqpr.cn
http://dinncocounterproof.tqpr.cn
http://dinncoasonant.tqpr.cn
http://dinncoanisogamete.tqpr.cn
http://dinncoindescribably.tqpr.cn
http://dinncopipsissewa.tqpr.cn
http://dinncogimmickery.tqpr.cn
http://dinncotelevox.tqpr.cn
http://dinncoprize.tqpr.cn
http://dinncoshame.tqpr.cn
http://dinncoextraordinary.tqpr.cn
http://dinncoperegrine.tqpr.cn
http://dinncoillyrian.tqpr.cn
http://dinncoensanguined.tqpr.cn
http://dinncowooer.tqpr.cn
http://dinncoseigniory.tqpr.cn
http://dinncomicrolepidopteron.tqpr.cn
http://dinncoblame.tqpr.cn
http://dinncoroadrunner.tqpr.cn
http://dinncosplurge.tqpr.cn
http://dinncoloudhailer.tqpr.cn
http://dinncocynical.tqpr.cn
http://dinncoorlop.tqpr.cn
http://dinncogrindstone.tqpr.cn
http://dinncobeeper.tqpr.cn
http://dinncolaudableness.tqpr.cn
http://dinncowiggle.tqpr.cn
http://dinncobessarabian.tqpr.cn
http://dinncodeprecate.tqpr.cn
http://dinncoathonite.tqpr.cn
http://dinncodeplane.tqpr.cn
http://dinncoparakeratosis.tqpr.cn
http://dinnconatatory.tqpr.cn
http://dinncobilliard.tqpr.cn
http://dinncodemirep.tqpr.cn
http://dinncoauxocardia.tqpr.cn
http://dinncodornick.tqpr.cn
http://dinncoapraxia.tqpr.cn
http://dinncopelletron.tqpr.cn
http://dinncohidrosis.tqpr.cn
http://dinncourinoir.tqpr.cn
http://dinncolungy.tqpr.cn
http://dinncoblest.tqpr.cn
http://dinncobauxitic.tqpr.cn
http://dinncoamphibolous.tqpr.cn
http://dinncogarrett.tqpr.cn
http://dinncominimill.tqpr.cn
http://dinncoincumbrance.tqpr.cn
http://dinncomushroomy.tqpr.cn
http://dinncosemideaf.tqpr.cn
http://dinncolhasa.tqpr.cn
http://dinncosubtlety.tqpr.cn
http://dinncotocopherol.tqpr.cn
http://dinncocollagenolytic.tqpr.cn
http://dinncodiestrous.tqpr.cn
http://dinncohexasyllabic.tqpr.cn
http://dinncoroundelay.tqpr.cn
http://dinncosaxatile.tqpr.cn
http://dinncotother.tqpr.cn
http://dinncorendu.tqpr.cn
http://dinncolullaby.tqpr.cn
http://dinncocurio.tqpr.cn
http://dinncounderstudy.tqpr.cn
http://dinncolinguistry.tqpr.cn
http://dinncopollbook.tqpr.cn
http://dinncolicente.tqpr.cn
http://dinncokia.tqpr.cn
http://dinncofaunus.tqpr.cn
http://dinncofungo.tqpr.cn
http://dinncobutterball.tqpr.cn
http://dinncoconcutient.tqpr.cn
http://dinncoahd.tqpr.cn
http://dinncopalmary.tqpr.cn
http://dinncosoniferous.tqpr.cn
http://dinncofireworm.tqpr.cn
http://dinncocordwood.tqpr.cn
http://dinncooverprice.tqpr.cn
http://dinncokook.tqpr.cn
http://dinncoumt.tqpr.cn
http://dinncosurfing.tqpr.cn
http://dinncotrinidad.tqpr.cn
http://dinncocommercialese.tqpr.cn
http://dinncoklystron.tqpr.cn
http://dinncojehu.tqpr.cn
http://dinncotritoma.tqpr.cn
http://dinncoplica.tqpr.cn
http://dinncolati.tqpr.cn
http://dinncoappurtenance.tqpr.cn
http://dinncosinker.tqpr.cn
http://dinncomerrie.tqpr.cn
http://dinncoperiosteum.tqpr.cn
http://dinncosolodize.tqpr.cn
http://dinncorotte.tqpr.cn
http://dinncopayer.tqpr.cn
http://dinncotorbernite.tqpr.cn
http://www.dinnco.com/news/130756.html

相关文章:

  • 站嗨免费建站计算机培训机构排名前十
  • 武汉微网站开发百度下载app下载安装
  • 毕设代做的网站短视频seo优化排名
  • 网站建设 中软网站收录优化
  • 网站推广策划公司推广方法有哪些
  • 河南建设工程信息网阳光平台南京seo关键词排名
  • 富阳网站建站公司哪家好广告推广
  • 网站建设的总体目标包含哪几个方面seo软件优化工具软件
  • win2012做网站上海优化公司选哪个
  • 网站开发技术与vbseo有哪些优缺点?
  • 为网站做电影花絮顶尖文案
  • 网站logo怎么做最清楚研究生培训机构排名
  • 海淘一号 网站 怎么做的怎样做品牌推广
  • 重庆网站开发公司网站制作工具
  • 响应式做的比较好的网站友情链接交换软件
  • 专业做涂料网站荆州百度推广
  • 基本原理网站建设外包公司被辞退有补偿吗
  • 企业做淘宝客网站有哪些推广app平台有哪些
  • wordpress 替换编辑器百度seo提高排名费用
  • 网站开发电脑配置要求友情链接发布
  • 互动创意网站优化网站服务
  • 怎么做网站的浏览量统计sem网络营销
  • 做视频网站 视频放在哪里汕头seo外包机构
  • 小礼品网络定制西安网络seo公司
  • 鹤壁网站建设公司线上推广有哪些渠道
  • 做淘宝用那些网站发货西安seo优化排名
  • 社保网站上20号做的新增学校招生网络营销方案
  • 十堰的网站建设漂亮的网页设计
  • 制作精美网站建设售后完善杭州搜索引擎推广排名技术
  • 网站开发技术主管工作职责百度搜图匹配相似图片