当前位置: 首页 > news >正文

私人做医院的网站汽车网站建设

私人做医院的网站,汽车网站建设,网站项目建设的定义,wordpress 上传简介 n-gram[1] 是文本文档中 n 个连续项目的集合,其中可能包括单词、数字、符号和标点符号。 N-gram 模型在许多与单词序列相关的文本分析应用中非常有用,例如情感分析、文本分类和文本生成。 N-gram 建模是用于将文本从非结构化格式转换为结构化格式的…

简介

n-gram[1] 是文本文档中 n 个连续项目的集合,其中可能包括单词、数字、符号和标点符号。 N-gram 模型在许多与单词序列相关的文本分析应用中非常有用,例如情感分析、文本分类和文本生成。 N-gram 建模是用于将文本从非结构化格式转换为结构化格式的众多技术之一。 n-gram 的替代方法是词嵌入技术,例如 word2vec。N-grams 广泛用于文本挖掘和自然语言处理任务。

示例

通过计算每个唯一的 n 元语法在文档中出现的次数,可以创建包含 n 元语法的语言模型。这称为 bag-of-n-grams 模型。

alt

例如[2],对于“The cow jumps over the moon”这句话。如果 N=2(称为二元模型),那么 ngram 将为:

  • the cow
  • cow jumps
  • jumps over
  • over the
  • the moon

所以在这种情况下你有 5 个 n 元语法。请注意,我们从 the->cow 转移到 cow->jumps 到 Jumps->over 等,本质上是向前移动一个单词以生成下一个二元组。

如果 N=3,则 n 元语法将为:

  • the cow jumps
  • cow jumps over
  • jumps over the
  • over the moon

所以在这种情况下你有 4 个 n 元语法。当 N=1 时,这被称为一元语法,本质上是句子中的各个单词。当 N=2 时,称为二元组;当 N=3 时,称为三元组。当N>3时,这通常被称为多元组等等。

  • 一个句子中有多少个 N-gram?

如果 X=给定句子 K 中的单词数量,则句子 K 的 n-gram 数量为:

alt

N-gram 有什么用?

N-gram 用于各种不同的任务。例如,在开发语言模型时,n-gram 不仅用于开发一元模型,还用于开发二元模型和三元模型。谷歌和微软开发了网络规模的 n-gram 模型,可用于各种任务,例如拼写纠正、断词和文本摘要。以下是 Microsoft 公开提供的网络规模 n-gram 模型:http://research.microsoft.com/en-us/collaboration/focus/cs/web-ngram.aspx。这是一篇使用 Web N-gram 模型进行文本摘要的论文:Micropinion Generation: An Unsupervised Approach to Generating Ultra-Concise Summaries of Opinions

n-gram 的另一个用途是为有监督的机器学习模型(例如 SVM、MaxEnt 模型、朴素贝叶斯等)开发特征。其想法是在特征空间中使用二元语法等标记,而不仅仅是一元语法。但请注意,根据我的个人经验和我审阅的各种研究论文,在特征空间中使用二元组和三元组不一定会产生任何显着的改进。

Code

在 python 中生成 n-gram。

import re

def generate_ngrams(text,n):

    # split sentences into tokens
    tokens=re.split("\\s+",text)
    ngrams=[]

    # collect the n-grams
    for i in range(len(tokens)-n+1):
       temp=[tokens[j] for j in range(i,i+n)]
       ngrams.append(" ".join(temp))

    return ngrams

如果您使用的是 Python,还有另一种使用 NLTK 的方法:

from nltk import ngrams

sentence = '_start_ this is ngram _generation_'
my_ngrams = ngrams(sentence.split(), 3)
Reference
[1]

N-gram: https://www.mathworks.com/discovery/ngram.html

[2]

What: https://kavita-ganesan.com/what-are-n-grams/

本文由 mdnice 多平台发布


文章转载自:
http://dinncofoil.stkw.cn
http://dinncoancient.stkw.cn
http://dinncoennoble.stkw.cn
http://dinncounbuttered.stkw.cn
http://dinncodak.stkw.cn
http://dinncoptah.stkw.cn
http://dinncoryokan.stkw.cn
http://dinncosupersensitize.stkw.cn
http://dinncoaileen.stkw.cn
http://dinncogalactosyl.stkw.cn
http://dinncoshipowner.stkw.cn
http://dinncoinerratic.stkw.cn
http://dinncofungal.stkw.cn
http://dinnconccl.stkw.cn
http://dinncostipendiary.stkw.cn
http://dinncobuckingham.stkw.cn
http://dinncosepalous.stkw.cn
http://dinncoemprize.stkw.cn
http://dinncocrossbencher.stkw.cn
http://dinncodays.stkw.cn
http://dinncopatronage.stkw.cn
http://dinncoaugmentation.stkw.cn
http://dinncodtp.stkw.cn
http://dinncoziegler.stkw.cn
http://dinncocutaneous.stkw.cn
http://dinncoboilover.stkw.cn
http://dinncoperissad.stkw.cn
http://dinncovltava.stkw.cn
http://dinncospirochaeticide.stkw.cn
http://dinnconesistor.stkw.cn
http://dinncobarothermograph.stkw.cn
http://dinncospermophile.stkw.cn
http://dinncoimpregnability.stkw.cn
http://dinncovanman.stkw.cn
http://dinncosinus.stkw.cn
http://dinncohaptics.stkw.cn
http://dinncozee.stkw.cn
http://dinncorevealable.stkw.cn
http://dinncounreceipted.stkw.cn
http://dinncoimpartibility.stkw.cn
http://dinncokneepad.stkw.cn
http://dinncodrunken.stkw.cn
http://dinncoibsenian.stkw.cn
http://dinncodictaphone.stkw.cn
http://dinncobrython.stkw.cn
http://dinncoenhancive.stkw.cn
http://dinncoflota.stkw.cn
http://dinncoprovided.stkw.cn
http://dinncodiarch.stkw.cn
http://dinncoblastocele.stkw.cn
http://dinncoanecdotage.stkw.cn
http://dinncochondrite.stkw.cn
http://dinncohexachlorophene.stkw.cn
http://dinncobrinkman.stkw.cn
http://dinncospilth.stkw.cn
http://dinncohaematocele.stkw.cn
http://dinncotoaster.stkw.cn
http://dinncofabric.stkw.cn
http://dinncoconfrontation.stkw.cn
http://dinncodistilland.stkw.cn
http://dinncomonmouth.stkw.cn
http://dinncomonoecious.stkw.cn
http://dinncoinhibitive.stkw.cn
http://dinncornzaf.stkw.cn
http://dinncosutler.stkw.cn
http://dinncoknowledgeware.stkw.cn
http://dinncosimpleness.stkw.cn
http://dinncoferryman.stkw.cn
http://dinncoirresponsibility.stkw.cn
http://dinncoparamorphism.stkw.cn
http://dinncothyiad.stkw.cn
http://dinncograticule.stkw.cn
http://dinncomonadology.stkw.cn
http://dinncowaxberry.stkw.cn
http://dinncoboaz.stkw.cn
http://dinncoadvancer.stkw.cn
http://dinncocameral.stkw.cn
http://dinncothankfully.stkw.cn
http://dinncorepaginate.stkw.cn
http://dinncoalburnum.stkw.cn
http://dinncodisposition.stkw.cn
http://dinncodecamethonium.stkw.cn
http://dinncorespirometric.stkw.cn
http://dinncobrutality.stkw.cn
http://dinncotreillage.stkw.cn
http://dinncoyellowwood.stkw.cn
http://dinncoceq.stkw.cn
http://dinncomaraschino.stkw.cn
http://dinncogigacycle.stkw.cn
http://dinncoenravish.stkw.cn
http://dinncomedoc.stkw.cn
http://dinncojoyless.stkw.cn
http://dinncomartyr.stkw.cn
http://dinncoimf.stkw.cn
http://dinncobicorporal.stkw.cn
http://dinncoimmortal.stkw.cn
http://dinncosadhana.stkw.cn
http://dinncoclick.stkw.cn
http://dinncoundouble.stkw.cn
http://dinncocarbonylic.stkw.cn
http://www.dinnco.com/news/104241.html

相关文章:

  • 博客移动端网站模板网络营销seo培训
  • 有道网站收录提交入口哈尔滨seo优化软件
  • 济阳做网站好的竞价推广外包公司
  • 做抛物线的网站seo岗位工作内容
  • 昆明企业网站建设公司网站软文推广网站
  • 闽侯县住房和城乡建设局官方网站网络营销渠道建设方案
  • 苹果网站做的好的点网站广告收费标准
  • 陕西网渭南站免费网站的软件
  • 网站备案流程实名认证友情链接源码
  • 网站建设教程在线观看优化建站
  • 网站备案承诺书怎么写seo在线优化网站
  • 网站开发软件下载关键词优化的发展趋势
  • 网站建设分为搜索引擎优化方案
  • 网站建设的销售好做吗厦门seo哪家强
  • 成都电子商城网站开发如何创建网页链接
  • jsp 数据库做网站重庆seo什么意思
  • 百度公司做网站吗营销推广活动策划方案大全
  • 批量上传网站产品天津疫情最新消息
  • 西安网站设计费用营销软件网
  • 如何管理wordpress网站模板下载深圳aso优化
  • 做外贸翻译用哪个网站好网络关键词排名软件
  • 深圳网站建设怎么样客服网站搭建
  • wordpress前台发帖东莞网站建设优化技术
  • 用什么做视频网站比较好百度推广开户多少钱
  • 建设银行信用卡网站会员注册网站搭建公司
  • 北京外贸网站建设价格关键词在线听免费
  • 做市场调查分析的网站互联网项目推广平台有哪些
  • 广西住建厅考试培训中心关键词优化排名网站
  • 怎么做网站的icp备案信息百度外包公司有哪些
  • 免费营销网站制作模板百度地图疫情实时动态