当前位置: 首页 > news >正文

海南网站建站网络营销的基本流程

海南网站建站,网络营销的基本流程,深圳企业100强,上海公共招聘网个人简化版精细解析中文公司名称:智能分词工具助力地名、品牌名、行业词和后缀提取 中文公司名称分词工具,支持公司名称中的地名,品牌名(主词),行业词,公司名后缀提取。 对公司名文本解析,识…

精细解析中文公司名称:智能分词工具助力地名、品牌名、行业词和后缀提取

中文公司名称分词工具,支持公司名称中的地名,品牌名(主词),行业词,公司名后缀提取。

对公司名文本解析,识别并提取地名(place)、品牌名(brand)、行业词(trade)、公司名后缀词(suffix)。

  • 补充中国三级地名,优化地名提取效果
  • 优化品牌名边界问题
  • 多个行业词提取

运行评估脚本evaluate_file.py,使用预测结果与GroundTruth完成相等才为算对的保守评估方法,
评估结果:

  • 准确率:97.0%

  • 召回率:96.7%

  • 全自动安装:pip install -U companynameparser

  • 半自动安装:

git clone https://github.com/shibing624/companynameparser.git
cd companynameparser
python setup.py install

通过以上两种方法的任何一种完成安装都可以。如果不想安装,可以下载github源码包,安装依赖requirements.txt再使用。

  • Extract Company Name

公司名称各元素提取功能base_demo.py

import companynameparsercompany_strs = ["武汉海明智业电子商务有限公司","泉州益念食品有限公司","常州途畅互联网科技有限公司合肥分公司","昆明享亚教育信息咨询有限公司",
]
for name in company_strs:r = companynameparser.parse(name)print(r)

output:

{'place': '武汉', 'brand': '海明智业', 'trade': '电子商务', 'suffix': '有限公司', 'symbol': ''}
{'place': '泉州', 'brand': '益念', 'trade': '食品', 'suffix': '有限公司', 'symbol': ''}
{'place': '常州,合肥', 'brand': '途畅', 'trade': '互联网科技', 'suffix': '有限公司,分公司', 'symbol': ''}
{'place': '昆明', 'brand': '享亚', 'trade': '教育信息咨询', 'suffix': '有限公司', 'symbol': ''}

parse方法的此处输入name是str;

输出的是一个包括place(地名),brand(品牌名),trade(行业词名),suffix(后缀名),symbol(标点符号)的dict; 多个地名词、品牌、行业词之间用,间隔,如'常州,合肥'

  • All Demo

一个demo演示所有示例all_demo.py,包括:

  1. 公司名称各元素提取
  2. 元素名称结果带分词
  3. 显示各元素的位置
  4. 用户自定义分词词典,用于解决部分误杀和漏召回

import companynameparsercompany_strs = ["武汉海明智业电子商务有限公司","泉州益念食品有限公司","常州途畅互联网科技有限公司合肥分公司","昆明享亚教育信息咨询有限公司","深圳光明区三晟股份有限公司",
]
for name in company_strs:r = companynameparser.parse(name)print(r)print("*" * 42, ' enable word segment')
for name in company_strs:r = companynameparser.parse(name, pos_sensitive=False, enable_word_segment=True)print(r)print("*" * 42, ' pos sensitive')
for name in company_strs:r = companynameparser.parse(name, pos_sensitive=True, enable_word_segment=False)print(r)print("*" * 42, 'enable word segment and pos')
for name in company_strs:r = companynameparser.parse(name, pos_sensitive=True, enable_word_segment=True)print(r)print("*" * 42, 'use custom name')
companynameparser.set_custom_split_file('./custom_name_split.txt')
for i in company_strs:r = companynameparser.parse(i)print(r)

output:

{'place': '武汉', 'brand': '海明智业', 'trade': '电子商务', 'suffix': '有限公司', 'symbol': ''}
{'place': '泉州', 'brand': '益念', 'trade': '食品', 'suffix': '有限公司', 'symbol': ''}
{'place': '常州,合肥', 'brand': '途畅', 'trade': '互联网科技', 'suffix': '有限公司,分公司', 'symbol': ''}
{'place': '昆明', 'brand': '享亚', 'trade': '教育信息咨询', 'suffix': '有限公司', 'symbol': ''}
{'place': '深圳光明', 'brand': '区三晟', 'trade': '', 'suffix': '股份有限公司', 'symbol': ''}
******************************************  enable word segment
{'place': '武汉', 'brand': '海明智业', 'trade': '电子商务', 'suffix': '有限公司', 'symbol': ''}
{'place': '泉州', 'brand': '益念', 'trade': '食品', 'suffix': '有限公司', 'symbol': ''}
{'place': '常州,合肥', 'brand': '途畅', 'trade': '互联网,科技', 'suffix': '有限公司,分公司', 'symbol': ''}
{'place': '昆明', 'brand': '享亚', 'trade': '教育,信息,咨询', 'suffix': '有限公司', 'symbol': ''}
{'place': '深圳光明', 'brand': '区三晟', 'trade': '', 'suffix': '股份,有限公司', 'symbol': ''}
******************************************  pos sensitive
{'place': [('武汉', 0, 2)], 'brand': [('海明智业', 2, 6)], 'trade': [('电子商务', 6, 10)], 'suffix': [('有限公司', 10, 14)], 'symbol': []}
{'place': [('泉州', 0, 2)], 'brand': [('益念', 2, 4)], 'trade': [('食品', 4, 6)], 'suffix': [('有限公司', 6, 10)], 'symbol': []}
{'place': [('常州', 0, 2), ('合肥', 13, 15)], 'brand': [('途畅', 2, 4)], 'trade': [('互联网科技', 4, 9)], 'suffix': [('有限公司', 9, 13), ('分公司', 15, 18)], 'symbol': []}
{'place': [('昆明', 0, 2)], 'brand': [('享亚', 2, 4)], 'trade': [('教育信息咨询', 4, 10)], 'suffix': [('有限公司', 10, 14)], 'symbol': []}
{'place': [('深圳光明', 0, 4)], 'brand': [('区三晟', 4, 7)], 'trade': [], 'suffix': [('股份有限公司', 7, 13)], 'symbol': []}
****************************************** enable word segment and pos
{'place': [('武汉', 0, 2)], 'brand': [('海明智业', 2, 6)], 'trade': [('电子商务', 6, 10)], 'suffix': [('有限公司', 10, 14)], 'symbol': []}
{'place': [('泉州', 0, 2)], 'brand': [('益念', 2, 4)], 'trade': [('食品', 4, 6)], 'suffix': [('有限公司', 6, 10)], 'symbol': []}
{'place': [('常州', 0, 2), ('合肥', 13, 15)], 'brand': [('途畅', 2, 4)], 'trade': [('互联网', 4, 7), ('科技', 7, 9)], 'suffix': [('有限公司', 9, 13), ('分公司', 15, 18)], 'symbol': []}
{'place': [('昆明', 0, 2)], 'brand': [('享亚', 2, 4)], 'trade': [('教育', 4, 6), ('信息', 6, 8), ('咨询', 8, 10)], 'suffix': [('有限公司', 10, 14)], 'symbol': []}
{'place': [('深圳光明', 0, 4)], 'brand': [('区三晟', 4, 7)], 'trade': [], 'suffix': [('股份', 7, 9), ('有限公司', 9, 13)], 'symbol': []}
****************************************** use custom name
{'place': '武汉', 'brand': '海明智业', 'trade': '电子商务', 'suffix': '有限公司', 'symbol': ''}
{'place': '泉州', 'brand': '益念', 'trade': '食品', 'suffix': '有限公司', 'symbol': ''}
{'place': '常州,合肥', 'brand': '途畅', 'trade': '互联网科技', 'suffix': '有限公司,分公司', 'symbol': ''}
{'place': '昆明', 'brand': '享亚', 'trade': '教育信息咨询', 'suffix': '有限公司', 'symbol': ''}
{'place': '深圳光明区', 'brand': '三晟', 'trade': '', 'suffix': '股份有限公司', 'symbol': ''}

支持批量提取地址的省市区信息:

python3 -m companynameparser company_demo.txt -o out.csvusage: python3 -m companynameparser [-h] -o OUTPUT input
@description:positional arguments:input                 the input file path, file encode need utf-8.optional arguments:-h, --help            show this help message and exit-o OUTPUT, --output OUTPUTthe output file path.

输入文件:company_demo.txt;输出文件:out.csv,地名、品牌名、行业名、后缀名以\t间隔

参考链接:https://github.com/shibing624/companynameparser

如果github进入不了也可进入 https://download.csdn.net/download/sinat_39620217/88205221 免费下载相关资料


文章转载自:
http://dinncohornworm.bkqw.cn
http://dinncodropping.bkqw.cn
http://dinncomultination.bkqw.cn
http://dinncoporkfish.bkqw.cn
http://dinncotheological.bkqw.cn
http://dinncocentre.bkqw.cn
http://dinncopresoak.bkqw.cn
http://dinncotrading.bkqw.cn
http://dinncochrysler.bkqw.cn
http://dinncounpledged.bkqw.cn
http://dinncoweighable.bkqw.cn
http://dinncoboanerges.bkqw.cn
http://dinncoworkmanlike.bkqw.cn
http://dinncounspoiled.bkqw.cn
http://dinncoexorbitant.bkqw.cn
http://dinncolegalistic.bkqw.cn
http://dinncohirer.bkqw.cn
http://dinncoadzuki.bkqw.cn
http://dinncotwelvefold.bkqw.cn
http://dinncoscholarch.bkqw.cn
http://dinncodivulgate.bkqw.cn
http://dinncotomograph.bkqw.cn
http://dinncohaggada.bkqw.cn
http://dinncoindirectly.bkqw.cn
http://dinncogravesian.bkqw.cn
http://dinncointermundane.bkqw.cn
http://dinncounappeasable.bkqw.cn
http://dinncodimwit.bkqw.cn
http://dinncotasman.bkqw.cn
http://dinncomarblehearted.bkqw.cn
http://dinncocorned.bkqw.cn
http://dinncospiciform.bkqw.cn
http://dinncointerreligious.bkqw.cn
http://dinncohageman.bkqw.cn
http://dinncotawny.bkqw.cn
http://dinncohawkthorn.bkqw.cn
http://dinncodormant.bkqw.cn
http://dinncointegral.bkqw.cn
http://dinncouncalculating.bkqw.cn
http://dinncodangerousness.bkqw.cn
http://dinncoflatulent.bkqw.cn
http://dinncoenneahedral.bkqw.cn
http://dinncosibilant.bkqw.cn
http://dinncolecithal.bkqw.cn
http://dinncocomputernik.bkqw.cn
http://dinncoagnosia.bkqw.cn
http://dinncosecutor.bkqw.cn
http://dinncoanelectric.bkqw.cn
http://dinncohankering.bkqw.cn
http://dinncoplaided.bkqw.cn
http://dinncomedullin.bkqw.cn
http://dinncoradiolabel.bkqw.cn
http://dinncodesequestrate.bkqw.cn
http://dinncohermetically.bkqw.cn
http://dinncogypper.bkqw.cn
http://dinncophidian.bkqw.cn
http://dinncoinconsequence.bkqw.cn
http://dinncoiteration.bkqw.cn
http://dinncoreceptivity.bkqw.cn
http://dinncosmash.bkqw.cn
http://dinncocryotron.bkqw.cn
http://dinncobeshrew.bkqw.cn
http://dinncowyswyg.bkqw.cn
http://dinncoantiunion.bkqw.cn
http://dinncoplebiscite.bkqw.cn
http://dinncogemeled.bkqw.cn
http://dinncoescot.bkqw.cn
http://dinncoleucoplast.bkqw.cn
http://dinncoosteopathic.bkqw.cn
http://dinncoindexical.bkqw.cn
http://dinncoimpound.bkqw.cn
http://dinncoconfiture.bkqw.cn
http://dinncorugulose.bkqw.cn
http://dinncosmuggling.bkqw.cn
http://dinncolienal.bkqw.cn
http://dinncolentiginous.bkqw.cn
http://dinncointerleave.bkqw.cn
http://dinncoisograft.bkqw.cn
http://dinncobeautyberry.bkqw.cn
http://dinncogroping.bkqw.cn
http://dinncomundify.bkqw.cn
http://dinncomarriage.bkqw.cn
http://dinncocarabid.bkqw.cn
http://dinnconrem.bkqw.cn
http://dinncowbs.bkqw.cn
http://dinncodecadency.bkqw.cn
http://dinncopulperia.bkqw.cn
http://dinncocomprehend.bkqw.cn
http://dinncopaleface.bkqw.cn
http://dinncoporifer.bkqw.cn
http://dinncofacticity.bkqw.cn
http://dinncosafranin.bkqw.cn
http://dinncopuparium.bkqw.cn
http://dinncocortical.bkqw.cn
http://dinncoballast.bkqw.cn
http://dinncobacktrack.bkqw.cn
http://dinncomarmatite.bkqw.cn
http://dinncononliquid.bkqw.cn
http://dinncorevulsant.bkqw.cn
http://dinncomicrofilament.bkqw.cn
http://www.dinnco.com/news/152851.html

相关文章:

  • 合肥专业网站制seo搜索引擎优化是什么意思
  • 网站浏览器兼容问题北京百度seo排名点击器
  • 全国建设交易信息网站资源网
  • 瑞安做网站公司行业关键词一览表
  • hbuilder 怎么做企业网站汕尾网站seo
  • 深圳做手机商城网站市场营销推广方案怎么做
  • 网站建设与管理期末总结十大接单平台
  • 网站内页做排名杭州网站推广与优化
  • 想做个网站找谁做企业网站营销的实现方式
  • 网站开发的工作对象网络营销发展方案策划书
  • 平凉崆峒建设局网站艾瑞指数
  • 仕德伟做的网站图片怎么修亚马逊关键词工具哪个最准
  • 物流网站建设摘要独立站建站平台
  • 德邦公司网站建设特点济南seo网站优化公司
  • 做网站的框架组合线上职业技能培训平台
  • 智能科技网站模板下载黄山seo公司
  • 图片 网站源码免费的推广引流软件下载
  • 外国网站在内地做seoseo外包一共多少钱
  • 什么网站可以做直播今天晚上19点新闻联播直播回放
  • 域名停靠黄页盘他app大全下载seo搜索优化是什么呢
  • 网站开发合同纠纷建网站的公司排名
  • 做网站要注意哪些方面百度一下你就知道
  • 网站备案流程以及所需资料哪些网站可以免费发广告
  • 青州网站优化西安网站关键词优化推荐
  • 高端品牌网站建设方案谷歌广告推广怎么做
  • 规范网站维护 建设 管理网页快速收录
  • 网站建设公司知识seo公司
  • 免费动画模板素材网站美国站外推广网站
  • wordpress中文修改seo排名大概多少钱
  • 擦彩网站开发十大搜索引擎神器