当前位置: 首页 > news >正文

企业vi设计公司哪家好seo 的作用和意义

企业vi设计公司哪家好,seo 的作用和意义,射洪做网站,合江网站建设文章目录 1.安装环境(可略过)2.模型简介(略读)抽取任务输入输出示例:1.实体识别2.关系抽取 3.快速上手(主菜)(1)转换数据标注数据样例 (2)生成训练数据训练数据样例 &…

文章目录

  • 1.安装环境(可略过)
  • 2.模型简介(略读)
    • 抽取任务输入输出示例:
      • 1.实体识别
      • 2.关系抽取
  • 3.快速上手(主菜)
    • (1)转换数据
      • ==标注数据样例==
    • (2)生成训练数据
      • ==训练数据样例==
    • (3)微调训练

1.安装环境(可略过)

模型快速复现的基本思路,只要两步,一是安装环境,二是跑模型。
安装GPU版本的paddlepaddle看参照此博客,如果不幸地,你报错缺少libcudart动态库文件,请参照此博客解决环境安装问题,毕竟安装环境是AIer不可逾越的鸿沟。

2.模型简介(略读)

知其然也知其所以然,能到快速上手阶段,肯定已经了解了UIE的一些相关介绍,这里仅从偏实践角度,简短剖析一下任务细节,具体介绍可参照官方github。

UIE(Universal Information Extraction) 针对少样本、低资源、不同领域等场景,实现从非结构化文本中抽取结构化信息,包含了实体识别、关系抽取、事件抽取、情感分析、评论抽取等任务。
该任务的亮点在于:
(1)将多任务的信息抽取统一为一个抽取模板
(2)基于结构化生成的预训练模型,可以实现少样本、跨领域的模型微调,且能够达到工业级可应用的SOTA效果。

统一模板可结合UIE整体框架来理解,如下图所示。
请添加图片描述
其底座是基于T5模型预训练的,多任务模型那就少不了prompt,这个prompt设计也非常巧妙,把prompt提示抽象成两种类别,Spotting进行实体识别,Associating进行关系类别识别,那么格式化就是:[spot] 实体类别 [asso] 关系类别 [text]。与实体识别、关系抽取、事件抽取任务联系起来,实体识别、事件触发词识别以及事件论元识别就是在做Spotting操作,找取目标信息片段,关系抽取、事件论元与事件触发词之间的关系是做Associating操作,寻找目标信息片段之间的关系。

对于不同的抽取任务只要给出统一的schema,那么模型就会自动将其组装为prompt喂给模型,进行Spotting、Associating操作。

抽取任务输入输出示例:

1.实体识别

from pprint import pprint>>> from paddlenlp import Taskflow
schema = [‘时间’, ‘选手’, ‘赛事名称’] # Define the schema for entity extraction
ie = Taskflow(‘information_extraction’, schema=schema)
pprint(ie(“2月8日上午北京冬奥会自由式滑雪女子大跳台决赛中中国选手谷爱凌以188.25分获得金牌!”)) # Better print results using pprint
[{‘时间’: [{‘end’: 6,
‘probability’: 0.9857378532924486,
‘start’: 0,
‘text’: ‘2月8日上午’}],
‘赛事名称’: [{‘end’: 23,
‘probability’: 0.8503089953268272,
‘start’: 6,
‘text’: ‘北京冬奥会自由式滑雪女子大跳台决赛’}],
‘选手’: [{‘end’: 31,
‘probability’: 0.8981548639781138,
‘start’: 28,
‘text’: ‘谷爱凌’}]}]

2.关系抽取

schema = {‘竞赛名称’: [‘主办方’, ‘承办方’, ‘已举办次数’]} # Define the schema for relation extraction>>> ie.set_schema(schema) # Reset schema>>> pprint(ie(‘2022语言与智能技术竞赛由中国中文信息学会和中国计算机学会联合主办,百度公司、中国中文信息学会评测工作委员会和中国计算机学会自然语言处理专委会承办,已连续举办4届,成为全球最热门的中文NLP赛事之一。’))
[{‘竞赛名称’: [{‘end’: 13,
‘probability’: 0.7825402622754041,
‘relations’: {‘主办方’: [{‘end’: 22,
‘probability’: 0.8421710521379353,
‘start’: 14,
‘text’: ‘中国中文信息学会’},
{‘end’: 30,
‘probability’: 0.7580801847701935,
‘start’: 23,
‘text’: ‘中国计算机学会’}],
‘已举办次数’: [{‘end’: 82,
‘probability’: 0.4671295049136148,
‘start’: 80,
‘text’: ‘4届’}],
‘承办方’: [{‘end’: 39,
‘probability’: 0.8292706618236352,
‘start’: 35,
‘text’: ‘百度公司’},
{‘end’: 72,
‘probability’: 0.6193477885474685,
‘start’: 56,
‘text’: ‘中国计算机学会自然语言处理专委会’},
{‘end’: 55,
‘probability’: 0.7000497331473241,
‘start’: 40,
‘text’: ‘中国中文信息学会评测工作委员会’}]},
‘start’: 0,
‘text’: ‘2022语言与智能技术竞赛’}]}]

以上的两个任务可以直接利用paddlenlp的Taskflow直接输出结果,这是预训练模型通用的抽取任务,输出效果也不错。Taskflow可理解为paddle为是产业实践研发的任务框架,包含数据的预处理、模型推理、后处理等任务执行所遵循的框架。细分场景中一般需要一定的标注数据进行微调。

3.快速上手(主菜)

项目中代码结构,如果不修改模型,不部署,仅微调的话,仅用到doccano.py、finetune.py、evaluate.py就足够了。
├── utils.py # 数据处理工具
├── model.py # 模型组网脚本
├── doccano.py # 数据标注脚本
├── doccano.md # 数据标注文档
├── finetune.py # 模型微调、压缩脚本
├── evaluate.py # 模型评估脚本
└── README.md

(1)转换数据

将自己的数据直接转化为doccona标注后的数据示例,为什么不直接转换为喂给模型的训练、验证数据,因为官方提供了转换脚本,里面包含正负样例构造、shuffle以及划分训练、验证、测试集,非常方便。

标注数据样例

{"id": 1, "text": "昨天晚上十点加班打车回家58元", "relations": [], "entities": [{"id": 0, "start_offset": 0, "end_offset": 6, "label": "时间"}, {"id": 1, "start_offset": 11, "end_offset": 12, "label": "目的地"}, {"id": 2, "start_offset": 12, "end_offset": 14, "label": "费用"}]}
{"id": 2, "text": "三月三号早上12点46加班,到公司54", "relations": [], "entities": [{"id": 3, "start_offset": 0, "end_offset": 11, "label": "时间"}, {"id": 4, "start_offset": 15, "end_offset": 17, "label": "目的地"}, {"id": 5, "start_offset": 17, "end_offset": 19, "label": "费用"}]}

注:我刚开始纠结该示例任务的schema = [‘出发地’, ‘目的地’, ‘费用’, ‘时间’],有的示例数据没有“目的地”无法定位offset怎么办?
准备标注数据的时候,没有的实体类别项,忽略不记录就行。
因为转换为训练数据集的时候,每个示例是根据类别分别转换的,如第一条数据,会转化为抽取"时间"类别数据,抽取"目的地"类别数据,抽取"费用"类别数据的3条数据,"出发地"类别就不用管。

(2)生成训练数据

经过doccona标注后的数据样例,通过doccona.py进行转换,生成训练集、验证集、测试集,命令如下所示。

python doccano.py \--doccano_file ./data/doccano_ext.json \--save_dir ./data \--splits 0.8 0.1 0.1 

训练数据样例

{"content": "出租车从酒店到公司一共34元时间是10月21日", "result_list": [{"text": "10月21日", "start": 17, "end": 23}], "prompt": "时间"}
{"content": "二零一九年十一月十三日晚上十点三十四分加班打车回家,四十三元", "result_list": [{"text": "家", "start": 24, "end": 25}], "prompt": "目的地"}
{"content": "月五号凌晨0点08分打车回家三十点五元", "result_list": [{"text": "家", "start": 13, "end": 14}], "prompt": "目的地"}

(3)微调训练

因为我有多张显卡,一开始想用多卡并行微调训练,没想到还需要安装一个ncll2,果断放弃,选择单卡也能微调,且速度挺快。总共100多条标注数据,生成训练集600多条数据,10多分钟就训练完了。
注意,我修改的参数,–device gpu:8 指定了特定的gpu,batch_size改为了8,因为显卡内存被别程序占用,8才能跑起来。
微调命令如下所示:

python finetune.py  \--device gpu:8 \--logging_steps 10 \--save_steps 100 \--eval_steps 100 \--seed 42 \--model_name_or_path uie-base \--output_dir $finetuned_model \--train_path data/train.txt \--dev_path data/dev.txt  \--max_seq_length 512  \--per_device_eval_batch_size 8 \--per_device_train_batch_size  8 \--num_train_epochs 20 \--learning_rate 1e-5 \--label_names "start_positions" "end_positions" \--do_train \--do_eval \--do_export \--export_model_dir $finetuned_model \--overwrite_output_dir \--disable_tqdm True \--metric_for_best_model eval_f1 \--load_best_model_at_end  True \--save_total_limit 1

参考:
[1].https://mp.weixin.qq.com/s/lL950H9T7UFsJRopuWQ59w
[2].https://github.com/PaddlePaddle/PaddleNLP/blob/develop/model_zoo/uie/README.md#%E6%A8%A1%E5%9E%8B%E5%BE%AE%E8%B0%83


文章转载自:
http://dinncocoincident.ssfq.cn
http://dinncoexclamative.ssfq.cn
http://dinncodeeryard.ssfq.cn
http://dinncopollack.ssfq.cn
http://dinncofilasse.ssfq.cn
http://dinncoparagenesis.ssfq.cn
http://dinncostedfast.ssfq.cn
http://dinncotoughy.ssfq.cn
http://dinncohondurean.ssfq.cn
http://dinncobari.ssfq.cn
http://dinncopergameneous.ssfq.cn
http://dinncocleat.ssfq.cn
http://dinncooppressive.ssfq.cn
http://dinncotutsan.ssfq.cn
http://dinncomesnalty.ssfq.cn
http://dinncorecollection.ssfq.cn
http://dinncobugeye.ssfq.cn
http://dinncoconveyer.ssfq.cn
http://dinncosafety.ssfq.cn
http://dinncohexavalent.ssfq.cn
http://dinncocordially.ssfq.cn
http://dinncosaccular.ssfq.cn
http://dinncoarterialize.ssfq.cn
http://dinncouneducational.ssfq.cn
http://dinncopub.ssfq.cn
http://dinncoaggravate.ssfq.cn
http://dinncononmoral.ssfq.cn
http://dinncopolymastigote.ssfq.cn
http://dinncogressorial.ssfq.cn
http://dinnconudge.ssfq.cn
http://dinncoclamworm.ssfq.cn
http://dinncomed.ssfq.cn
http://dinncofreehanded.ssfq.cn
http://dinncomove.ssfq.cn
http://dinncoalbina.ssfq.cn
http://dinncotwenty.ssfq.cn
http://dinncosidonian.ssfq.cn
http://dinncoopening.ssfq.cn
http://dinncothrombocytopenia.ssfq.cn
http://dinncoozonize.ssfq.cn
http://dinncolinum.ssfq.cn
http://dinncospiroid.ssfq.cn
http://dinncosynechia.ssfq.cn
http://dinncomonomachy.ssfq.cn
http://dinncoserendipper.ssfq.cn
http://dinncodiplopod.ssfq.cn
http://dinncoslack.ssfq.cn
http://dinncomagnanimity.ssfq.cn
http://dinncoschtick.ssfq.cn
http://dinncosquareness.ssfq.cn
http://dinncoscotopia.ssfq.cn
http://dinncoavaluative.ssfq.cn
http://dinncoswop.ssfq.cn
http://dinncoriverain.ssfq.cn
http://dinncodeliveryman.ssfq.cn
http://dinncoopalize.ssfq.cn
http://dinncowinnable.ssfq.cn
http://dinncodouai.ssfq.cn
http://dinncoevan.ssfq.cn
http://dinncomonosaccharide.ssfq.cn
http://dinncotolyl.ssfq.cn
http://dinncomonkhood.ssfq.cn
http://dinncoameliorable.ssfq.cn
http://dinncocomous.ssfq.cn
http://dinncosuckerfish.ssfq.cn
http://dinncomelanophore.ssfq.cn
http://dinncocenobian.ssfq.cn
http://dinncojudgmatic.ssfq.cn
http://dinncoroentgenite.ssfq.cn
http://dinncotimeslice.ssfq.cn
http://dinncohistographically.ssfq.cn
http://dinncoanthracitic.ssfq.cn
http://dinncoassistance.ssfq.cn
http://dinncococcid.ssfq.cn
http://dinncogleg.ssfq.cn
http://dinncoreversal.ssfq.cn
http://dinncorockslide.ssfq.cn
http://dinncopotentially.ssfq.cn
http://dinncoabiogenetic.ssfq.cn
http://dinncohemolysis.ssfq.cn
http://dinncostud.ssfq.cn
http://dinncogenerant.ssfq.cn
http://dinncosighthole.ssfq.cn
http://dinncodithiocarbamate.ssfq.cn
http://dinncosystematizer.ssfq.cn
http://dinncomovieola.ssfq.cn
http://dinncotetrastichous.ssfq.cn
http://dinncosaiva.ssfq.cn
http://dinncodredging.ssfq.cn
http://dinncoencapsulate.ssfq.cn
http://dinnconobleness.ssfq.cn
http://dinncosilicate.ssfq.cn
http://dinncoskutari.ssfq.cn
http://dinncoshortite.ssfq.cn
http://dinncogasper.ssfq.cn
http://dinncounretentive.ssfq.cn
http://dinncoabnormal.ssfq.cn
http://dinncoyemen.ssfq.cn
http://dinncoyangon.ssfq.cn
http://dinncopachouli.ssfq.cn
http://www.dinnco.com/news/131791.html

相关文章:

  • 邢台市的做网站制作公司广州百度推广代理公司
  • 自己的网站怎么做seo自己建网站怎么建
  • 网站登录系统企业网站推广有哪些方式
  • 做网站需要哪些东西和步骤自动提取关键词的软件
  • 国外网站兼职做效果图黑帽seo排名技术
  • 罗湖做网站的公司哪家好seo营销论文
  • 哪个企业的网站做的比较好搜客
  • 沈阳网站建设公司的公司实时排名软件
  • 中文域名注册网站阿里云域名查询
  • 珠海模板建站公司网站制作推广电话
  • 网站建设是设计师吗北京网站优化对策
  • 网站如何做快捷支付北京网络营销推广培训哪家好
  • 用ul做的网站为何浮动不上去搜索引擎优化案例
  • 从零做网站百度网页版登录入口官网
  • 有没有做高仿手表的网站网络营销的盈利模式
  • 百度宿迁市建设局网站淘宝流量平台
  • 新闻wordpress主题一个企业seo网站的优化流程
  • 创意营销案例seo兼职招聘
  • 四川有那些网站建设公司关联词有哪些四年级
  • 企业所得税税率5% 10% 25%自动seo优化
  • 政府网站建设 托管百度快照官网登录
  • 前端asp网站开发亚马逊站外推广网站
  • 一个正规的网站建设公司惠州关键词排名提升
  • 厦门网站建设找哪家比较好济南seo怎么优化
  • 电商网站设计公司有哪些陕西网站建设制作
  • 学校网站做网页飘窗怎么做广告营销包括哪些方面
  • wordpress shopping网站seo培训
  • 电子商务怎样建立网站的微信营销推广的方式有哪些
  • 上海做网站 公司有哪些平台可以做推广
  • 做网站推广 seo的竞价排名是按照什么来计费的