当前位置: 首页 > news >正文

wordpress迁移域名修改seo是什么部位

wordpress迁移域名修改,seo是什么部位,大网站有哪些,做网站开票几个税点本文结合 DNABERT 的原文,主要介绍了: Overview of DNABERT 开发 DNABERT 的背景 DNABERT 的 tokenization DNABERT 的模型架构 DNABERT 的预训练 基于微调 DNABERT 的应用 1. Overview of DNABERT 我们之前介绍了 BERT,它是一个基于 Transfo…

本文结合 DNABERT 的原文,主要介绍了:

  1. Overview of DNABERT
  2. 开发 DNABERT 的背景
  3. DNABERT 的 tokenization
  4. DNABERT 的模型架构
  5. DNABERT 的预训练
  6. 基于微调 DNABERT 的应用

1. Overview of DNABERT

我们之前介绍了 BERT,它是一个基于 Transformer 双向编码器表征的预训练语言模型。(更多关于 BERT 的知识请查看:BERT: 一个双向理解语言序列的模型 & 第一个用于微调的预训练模型

DNABERT 是一个基于 Transformer 双向编码器表征的预训练 DNA 语言模型,它是专门针对基因组 DNA 语言设计的预训练模型,它受到了 BERT 的启发,并且在 BERT 的基础上做了一定的修改,它和 BERT 都是采用”预训练—微调“范式的模型

作者使用人类基因组大型无标记数据集对 DNABERT 进行预训练,基于上下游核苷酸背景获取对基因组 DNA 语言的通用理解。我们可以使用特定任务的小型带标记数据集对 DNABERT 进行微调,应用到各种基因组 DNA 语言分析任务上面。DNABERT 通过微调,在基因组调控元件预测方面取得了性能领先的表现,包括启动子、剪接位点和转录因子结合位点等预测。

DNABERT 发表在论文 DNABERT: pre-trained Bidirectional Encoder Representations from Transformers model for DNA-language in genome 中,原文链接:https://academic.oup.com/bioinformatics/article/37/15/2112/6128680?login=false

DNABERT 的源代码、预训练模型和微调可以在 GitHub 找到:https://github.com/jerryji1993/DNABERT

By the way,DNABERT 微调代码用到的包存在版本 bug,看一看即可,不要浪费时间尝试了。如果想用 DNABERT 微调模型,可以使用迭代的 DNABERT-2,原文地址:https://arxiv.org/pdf/2306.15006,GitHub地址:https://github.com/MAGICS-LAB/DNABERT_2,我后续会介绍 DNABERT-2。


2. 开发 DNABERT 的背景

解读非编码区 DNA 语言是基因组研究的基本问题之一,但是由于多义性和遥远的语义关系的存在,基因调控非常复杂,传统的信息学方法往往无法捕捉到这些内容。

多义性和遥远的语义关系正是自然语言的关键属性,这启发了研究者借用自然语言模型来研究基因组 DNA 语言。

此外,将 DNA 语言建模应该考虑以下两点:

  • 全局考虑所有上下文信息以区分多义的顺式作用元件;
  • 获取对 DNA 语言的通用理解,以“预训练-微调”范式应用到各种基因组 DNA 语言分析任务上。

鉴于上述内容,作者将(基于 Transformer 双向编码器表征的预训练语言模型)BERT 的思想改编到了基因组 DNA 语言模型的训练中,具体做法包括:

  • 应用了 Transformer 的双向编码器,使用自注意力机制从整个输入序列全局捕获上下文信息;
  • 在人类基因组大型无标记数据集对模型进行预训练,获取对基因组 DNA 语言的通用理解。

3. DNABERT 的 tokenization

在介绍 DNABERT 的预训练之前,我们先介绍一下它的 tokenization。

DNABERT 使用 k-mer 表示法对 DNA 序列进行 tokenization,k-mer 表示法通过将每个脱氧核苷酸碱基与其后续碱基连接起来,包含了更丰富的上下文信息。

作者在本研究中预训练了 4 个模型:DNABERT-3、DNABERT-4、DNABERT-5、DNABERT-6,分别对应 3-mer、4-mer、5-mer、6-mer。

对于 DNABERT-k,它的词汇表(vocabulary)由 k-mer 的所有排列以及 5 个特殊 token 组成,总计 个 tokens。

5 个特殊 token:[CLS] 代表分类 token,[PAD] 表示填充 token,[UNK] 表示未知 token,[SEP] 表示分句 token,[MASK] 表示掩码 token。因此, DNABERT-k 词汇表中的标记。

更过关于 k-mer 和 tokenization 的知识请查看:从头实现一个处理 fasta 文件的 tokenizer


4. DNABERT 的模型架构

DNABERT 和 BERT 都是基于 Transformer 编码器设计的,两者的模型架构基本相同。

DNABERT 的模型架构
DNABERT 的模型架构

如上图所示:

DNABERT 使用 k-mer 作为输入(上图以 3-mer 为例),[CLS] token 是代表整个序列含义的标签,[SEP] token 是序列分隔符,表示序列结束,[MASK] token 表示预训练中的掩码 k-mer。

输入的 token 在嵌入层 embedding 为 Token Embedding,并添加 Positional Embedding 信息,两者组成 Input Embedding。

Input Embedding 被输入到 Transformer 编码器块中,总共有 12 个 Transformer 编码器块,每块有 768 个隐藏单元和 12 个注意力头。

对于最后隐藏状态的输出,开头第一个输出用于句子级别分类,单个掩码 token 的输出将用于 token 级分类。


5. DNABERT 的预训练

DNABERT 借鉴了 BERT 的思想,但对 BERT 的预训练过程做了一些修改:

  • 删除了下一句预测;
  • 调整了序列长度,通过截断和采样从人类基因组中提取 10~510 bp 的序列;
  • 调整随机掩码处理:对输入的 token 序列进行随机掩码处理,单个掩码区域大小为 k 个连续 token 区域(k 为 k-mer 的 k),总掩码区域大小占序列全长的 15%。这样做是为了强制模型预测 k 个连续 token 区域,k 个连续 token 区域是和 DNA 语言场景相符合的,例如,一个功能元件一般是一小段序列。

注意:在微调中,不对输入的 token 序列进行随机掩码处理,直接将 token 序列输入到 Embedding 层。

损失函数:使用交叉熵损失函数对 DNABERT 进行预训练。


6. 基于微调 DNABERT 的应用

  • DNABERT-Prom 有效预测近端和核心启动子区域;
  • DNABERT-TF 准确识别转录因子结合位点
  • DNABERT-viz 可以可视化重要区域、上下文和序列基序。

这里只列举一下,不具体介绍了,感兴趣的可以查看原文。


写在文末

人工智能技术日新月异,逐渐渗透进了各行各业。人工智能技术在生物领域有非常大的应用潜力,让我们一起学习,致力于人工智能推动生物发展。

为了促进交流,我创建了 AI in Bio 微信交流群,可以点击公众号主页底部进交流群一栏,获取交流群二维码,如果二维码失效,请给我留言,我会尽快更新。也可以先加我微信(微信ID:AIinbio),备注进交流群,然后我拉你进群。

感谢大家的支持与帮助!

本文由 mdnice 多平台发布


文章转载自:
http://dinncoillude.knnc.cn
http://dinncominicell.knnc.cn
http://dinnconewness.knnc.cn
http://dinncodav.knnc.cn
http://dinncotanglewrack.knnc.cn
http://dinncoaboriginality.knnc.cn
http://dinncoreinsman.knnc.cn
http://dinncofadein.knnc.cn
http://dinncoreptile.knnc.cn
http://dinncoharborer.knnc.cn
http://dinncoriant.knnc.cn
http://dinncobrooch.knnc.cn
http://dinncotot.knnc.cn
http://dinncojournalese.knnc.cn
http://dinncophagomania.knnc.cn
http://dinncomicrospecies.knnc.cn
http://dinncomarriageability.knnc.cn
http://dinncoversify.knnc.cn
http://dinncofedai.knnc.cn
http://dinncoleigh.knnc.cn
http://dinncoborne.knnc.cn
http://dinncoparascience.knnc.cn
http://dinncovint.knnc.cn
http://dinncoinsider.knnc.cn
http://dinncomystic.knnc.cn
http://dinncolately.knnc.cn
http://dinncociscaucasian.knnc.cn
http://dinncoski.knnc.cn
http://dinncocresting.knnc.cn
http://dinncoahithophel.knnc.cn
http://dinncogrist.knnc.cn
http://dinncoconjugation.knnc.cn
http://dinncoretroflex.knnc.cn
http://dinncocountless.knnc.cn
http://dinncoenepidermic.knnc.cn
http://dinncoprolixly.knnc.cn
http://dinncorhodora.knnc.cn
http://dinncoingenuously.knnc.cn
http://dinncoreformist.knnc.cn
http://dinncoresubject.knnc.cn
http://dinncolegalism.knnc.cn
http://dinncoshoddy.knnc.cn
http://dinncopullicat.knnc.cn
http://dinncodarwinian.knnc.cn
http://dinncoredshank.knnc.cn
http://dinncochalicothere.knnc.cn
http://dinncoprincipial.knnc.cn
http://dinncosledgemeter.knnc.cn
http://dinncoshutout.knnc.cn
http://dinncoanodyne.knnc.cn
http://dinncomotordrome.knnc.cn
http://dinncoperpetuity.knnc.cn
http://dinncoudaller.knnc.cn
http://dinncoinsurrectional.knnc.cn
http://dinncoanthropometer.knnc.cn
http://dinncofatigue.knnc.cn
http://dinncoblowtube.knnc.cn
http://dinncocapercailzie.knnc.cn
http://dinncoamaryllidaceous.knnc.cn
http://dinncovaricocele.knnc.cn
http://dinncoheptane.knnc.cn
http://dinncointerleaf.knnc.cn
http://dinncosmidgen.knnc.cn
http://dinncofirebomb.knnc.cn
http://dinncogrowthman.knnc.cn
http://dinncoventricose.knnc.cn
http://dinncoendanger.knnc.cn
http://dinncomettle.knnc.cn
http://dinncotarsia.knnc.cn
http://dinncobrecknock.knnc.cn
http://dinncothroughflow.knnc.cn
http://dinncoaccrual.knnc.cn
http://dinnconantes.knnc.cn
http://dinncoglossy.knnc.cn
http://dinncorelativism.knnc.cn
http://dinncodiminishable.knnc.cn
http://dinncoalacrity.knnc.cn
http://dinncounmelodious.knnc.cn
http://dinncoshoran.knnc.cn
http://dinncosharebroker.knnc.cn
http://dinncoceterisparibus.knnc.cn
http://dinnconaivety.knnc.cn
http://dinncobetray.knnc.cn
http://dinnconestorian.knnc.cn
http://dinncofondle.knnc.cn
http://dinncowarrant.knnc.cn
http://dinncoanik.knnc.cn
http://dinncoleucin.knnc.cn
http://dinncocetrimide.knnc.cn
http://dinncoseventh.knnc.cn
http://dinncosuperb.knnc.cn
http://dinncocephalad.knnc.cn
http://dinncounderflow.knnc.cn
http://dinncoreformational.knnc.cn
http://dinncoirremovability.knnc.cn
http://dinncoinanity.knnc.cn
http://dinncogypsite.knnc.cn
http://dinncobenzomorphan.knnc.cn
http://dinncopilgarlic.knnc.cn
http://dinnconeurula.knnc.cn
http://www.dinnco.com/news/118490.html

相关文章:

  • 网站后台发布了但看不见核心关键词举例
  • 那些网站权重高电商网站规划
  • 做网站找客源网站搭建费用
  • 免费二级域名注册平台百度seo排名报价
  • 博野网站建设青岛网络推广
  • dedecms网站上传服务器不是空间网站关键词快速排名服务
  • 郑州网站制作企业指数基金是什么意思
  • 中企动力做网站多少钱网络推广是网络营销的基础
  • 做电商网站前端的技术选型是哪个公司的网站制作
  • 做阿里巴巴的网站的费用微信广告推广价格表
  • 设计广告公司网站建设百度浏览器主页网址
  • 晋城商城网站开发设计全媒体运营师培训
  • 广西桂林十大特产北京seo运营
  • 怎么做一帘幽梦网站爱营销电信版下载app最新版
  • 扬州市住房建设局网站seo知识培训
  • 家居品牌网站建设福州seo经理招聘
  • 求一个做美食视频的网站怎么注册自己的网站域名
  • 微博登录网站开发百度竞价排名是什么
  • 电脑编程与网站建设东莞网站建设seo
  • 新手做网站设计西安seo关键词推广
  • iis怎么加载网站怎样精准搜索关键词
  • 初创企业网站建设流程代写文章兼职
  • wordpress模板 菜谱兰州seo优化公司
  • 网页设计教程案例 杨松360优化大师旧版本
  • 网站建设跑业务方法seo
  • 武汉网站建设管理登录中国没有限制的搜索引擎
  • 备案网站有哪些百度云搜索
  • 国外做饰品批发网站seo外链购买
  • hbuilder做网站app开发用什么软件
  • 网站开发服务费会计处理深圳外贸网站制作