当前位置: 首页 > news >正文

专门做地方特产的网站快速排名软件seo系统

专门做地方特产的网站,快速排名软件seo系统,装修在线设计平台,24手表网站阿里巴巴近期发布了开源语音大模型项目FunAudioLLM,该项目包含了两个核心模型:SenseVoice和CosyVoice。可以精准多语言识别并且进行语音克隆。 SenseVoice:精准多语言识别与情感辨识 SenseVoice主要致力于高精度多语言语音识别、情感辨识和…

阿里巴巴近期发布了开源语音大模型项目FunAudioLLM,该项目包含了两个核心模型:SenseVoice和CosyVoice。可以精准多语言识别并且进行语音克隆。

SenseVoice:精准多语言识别与情感辨识

SenseVoice主要致力于高精度多语言语音识别、情感辨识和音频事件检测,支持超过50种语言的识别,其效果显著优于现有的Whisper模型,尤其在中文和粤语识别上提升超过50%。该模型不仅能够准确识别语音,还能辨别音乐、掌声、笑声、哭声、咳嗽和喷嚏等常见人机交互事件。多方面的测试显示,SenseVoice在情感辨识能力上也取得了行业领先的成果,能够检测到多种情感表现。

语音识别效果

我们在开源基准数据集(包括 AISHELL-1、AISHELL-2、Wenetspeech、Librispeech和Common Voice)上比较了SenseVoice与Whisper的多语言语音识别性能和推理效率。在中文和粤语识别效果上,SenseVoice-Small模型具有明显的效果优势。

在这里插入图片描述

情感识别效果

由于目前缺乏被广泛使用的情感识别测试指标和方法,我们在多个测试集的多种指标进行测试,并与近年来Benchmark上的多个结果进行了全面的对比。所选取的测试集同时包含中文/英文两种语言以及表演、影视剧、自然对话等多种风格的数据,在不进行目标数据微调的前提下,SenseVoice能够在测试数据上达到和超过目前最佳情感识别模型的效果。

在这里插入图片描述

同时,我们还在测试集上对多个开源情感识别模型进行对比,结果表明,SenseVoice-Large模型可以在几乎所有数据上都达到了最佳效果,而SenseVoice-Small模型同样可以在多数数据集上取得超越其他开源模型的效果。

在这里插入图片描述

事件检测效果

尽管SenseVoice只在语音数据上进行训练,它仍然可以作为事件检测模型进行单独使用。我们在环境音分类ESC-50数据集上与目前业内广泛使用的BEATS与PANN模型的效果进行了对比。SenseVoice模型能够在这些任务上取得较好的效果,但受限于训练数据与训练方式,其事件分类效果专业的事件检测模型相比仍然有一定的差距。

在这里插入图片描述

CosyVoice:自然语音生成的新标杆

CosyVoice则聚焦于自然语音生成,支持多语言、音色和情感控制,涵盖中文、英文、日文、粤语和韩语五种语言的生成。与传统语音生成模型相比,CosyVoice在生成效果上有显著提升。它仅需要3至10秒的原始音频,即可生成模拟音色,包含韵律和情感等细节,甚至能够实现跨语言的语音生成。
此外,CosyVoice还支持通过富文本或自然语言形式,对生成语音的情感和韵律进行细粒度控制,大大提升了生成语音在情感表现力上的细腻程度。

产品优势

  • 高度拟人化:采用阿里通义语音实验室自研的CosyVoice 生成式神经网络语音大模型算法,使生成的语音在语调、韵律、情感表达等方面达到超拟人程度。

  • 多样化音色选择:提供海量优质的音库资源,包括不同性别、年龄、方言以及各种特色声音,满足用户在不同场景下的个性化需求。无论是新闻播报的庄重严肃,还是故事讲述的情感丰富,都能轻松驾驭。

  • 实时高效合成:系统具有出色的响应速度和流式语音合成处理能力,无论是长篇文档还是短句指令,都能实现快速、准确的实时语音合成。

  • 支持富语言声音事件以及多情感的高拟人语音生成,例如笑声、语气词等,以及不同情感表现的高拟人语音生成。

  • 灵活应用广泛:适用于多种应用场景,如智能客服、有声读物、车载导航、教育辅导等,极大地拓宽了语音交互的可能性,提升用户体验的同时,也为企业智能化转型提供了强大支持。

目前两个模型均可在 ModelSpace 和 HuggingFace 上找到并下载。

我在Lab上按照 Github 二者的 README.md运行了。但是发现官方使用 Python 8 且 Pytorch都没用上 Ver 2,所以我直接照着requirements.txt 在默认 Python 10 的 Lab 环境上运行:

SenseVoice

jupyter notebook

!pip install torch torchaudio modelscope huggingface huggingface_hub funasr numpy
from funasr import AutoModelmodel_dir = "iic/SenseVoiceSmall"
input_file = ("https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/ASR/test_audio/asr_example_zh.wav"
)model = AutoModel(model=model_dir,vad_model="fsmn-vad",vad_kwargs={"max_single_segment_time": 30000},trust_remote_code=True, device="cuda:0")res = model.generate(input=input_file,cache={},language="zh", # "zn", "en", "yue", "ja", "ko", "nospeech"use_itn=False,batch_size_s=0,
)print(res)

CosyVoice

jupyter notebook

!pip install conformer deepspeed diffusers gdown gradio grpcio grpcio-tools hydra-core HyperPyYAML inflect librosa lightning matplotlib modelscope networkx omegaconf onnxruntime-gpu onnxruntime openai-whisper protobuf pydantic rich soundfile tensorboard torch torchaudio wget!apt-get install sox libsox-dev
import os
os.chdir('/content/CosyVoice')# SDK模型下载
from modelscope import snapshot_download
snapshot_download('iic/CosyVoice-300M', local_dir='pretrained_models/CosyVoice-300M')
snapshot_download('iic/CosyVoice-300M-SFT', local_dir='pretrained_models/CosyVoice-300M-SFT')
snapshot_download('iic/CosyVoice-300M-Instruct', local_dir='pretrained_models/CosyVoice-300M-Instruct')
snapshot_download('iic/CosyVoice-ttsfrd', local_dir='pretrained_models/CosyVoice-ttsfrd')
!export PYTHONPATH=third_party/Matcha-TTS
!pip install matcha-tts
import os
os.chdir('/content/CosyVoice')from cosyvoice.cli.cosyvoice import CosyVoice
from cosyvoice.utils.file_utils import load_wav
import torchaudiocosyvoice = CosyVoice('pretrained_models/CosyVoice-300M-SFT')
# sft usage
print(cosyvoice.list_avaliable_spks())
output = cosyvoice.inference_sft('你好,我是通义生成式语音大模型,请问有什么可以帮您的吗?', '中文女')
torchaudio.save('sft.wav', output['tts_speech'], 22050)cosyvoice = CosyVoice('pretrained_models/CosyVoice-300M')
# zero_shot usage, <|zh|><|en|><|jp|><|yue|><|ko|> for Chinese/English/Japanese/Cantonese/Korean
prompt_speech_16k = load_wav('zero_shot_prompt.wav', 16000)
output = cosyvoice.inference_zero_shot('收到好友从远方寄来的生日礼物,那份意外的惊喜与深深的祝福让我心中充满了甜蜜的快乐,笑容如花儿般绽放。', '希望你以后能够做的比我还好呦。', prompt_speech_16k)
torchaudio.save('zero_shot.wav', output['tts_speech'], 22050)
# cross_lingual usage
prompt_speech_16k = load_wav('cross_lingual_prompt.wav', 16000)
output = cosyvoice.inference_cross_lingual('<|en|>And then later on, fully acquiring that company. So keeping management in line, interest in line with the asset that\'s coming into the family is a reason why sometimes we don\'t buy the whole thing.', prompt_speech_16k)
torchaudio.save('cross_lingual.wav', output['tts_speech'], 22050)cosyvoice = CosyVoice('pretrained_models/CosyVoice-300M-Instruct')
# instruct usage, support <laughter></laughter><strong></strong>[laughter][breath]
output = cosyvoice.inference_instruct('在面对挑战时,他展现了非凡的<strong>勇气</strong>与<strong>智慧</strong>。', '中文男', 'Theo \'Crimson\', is a fiery, passionate rebel leader. Fights with fervor for justice, but struggles with impulsiveness.')
torchaudio.save('instruct.wav', output['tts_speech'], 22050)

个人感觉平台更靠向ModelSpace。哎,学不完,根本学不完!

我会定期在CSDN分享我的学习心得,项目经验和行业动态。如果你对某个领域感兴趣,或者想要了解更多技术干货,请关注我的账号,一起成长!


文章转载自:
http://dinncogch.ssfq.cn
http://dinncoheretic.ssfq.cn
http://dinncobuntline.ssfq.cn
http://dinncorockfish.ssfq.cn
http://dinncoinferno.ssfq.cn
http://dinncoborecole.ssfq.cn
http://dinncophotographica.ssfq.cn
http://dinncoesotropia.ssfq.cn
http://dinncogaleeny.ssfq.cn
http://dinncomammoplasty.ssfq.cn
http://dinncointercede.ssfq.cn
http://dinncogranth.ssfq.cn
http://dinncosoubise.ssfq.cn
http://dinncodownrange.ssfq.cn
http://dinncounenlivened.ssfq.cn
http://dinncodetrain.ssfq.cn
http://dinncodemurrer.ssfq.cn
http://dinncoeightpenny.ssfq.cn
http://dinnconfd.ssfq.cn
http://dinncomakeable.ssfq.cn
http://dinncohaboob.ssfq.cn
http://dinncobruxelles.ssfq.cn
http://dinncocoricidin.ssfq.cn
http://dinncofulness.ssfq.cn
http://dinncohypercorrectness.ssfq.cn
http://dinncocontactor.ssfq.cn
http://dinncoadder.ssfq.cn
http://dinncophilology.ssfq.cn
http://dinncoroominess.ssfq.cn
http://dinncoblackamoor.ssfq.cn
http://dinncotoxaphene.ssfq.cn
http://dinncomissourian.ssfq.cn
http://dinncomicroseismology.ssfq.cn
http://dinncojacamar.ssfq.cn
http://dinncoarrenotokous.ssfq.cn
http://dinncomonsveneris.ssfq.cn
http://dinncoannatto.ssfq.cn
http://dinncomixer.ssfq.cn
http://dinncopiteously.ssfq.cn
http://dinncostriker.ssfq.cn
http://dinncodisenable.ssfq.cn
http://dinncoethylation.ssfq.cn
http://dinncopauldron.ssfq.cn
http://dinncophotons.ssfq.cn
http://dinncosymbion.ssfq.cn
http://dinncoumbellifer.ssfq.cn
http://dinncofuddle.ssfq.cn
http://dinncospeakable.ssfq.cn
http://dinncotusser.ssfq.cn
http://dinncosulphatise.ssfq.cn
http://dinncoparachutist.ssfq.cn
http://dinncohyperirritable.ssfq.cn
http://dinncodissepiment.ssfq.cn
http://dinncothousandth.ssfq.cn
http://dinncocashaw.ssfq.cn
http://dinncotopping.ssfq.cn
http://dinncolinkage.ssfq.cn
http://dinncoduotone.ssfq.cn
http://dinncorecord.ssfq.cn
http://dinncovodka.ssfq.cn
http://dinncosable.ssfq.cn
http://dinncodunnite.ssfq.cn
http://dinncopostsynchronization.ssfq.cn
http://dinncomicros.ssfq.cn
http://dinncowaldenstrom.ssfq.cn
http://dinncoarcanum.ssfq.cn
http://dinncobootstrap.ssfq.cn
http://dinncobanishment.ssfq.cn
http://dinncoganglionic.ssfq.cn
http://dinncosuffuse.ssfq.cn
http://dinncohonesttogod.ssfq.cn
http://dinncohardening.ssfq.cn
http://dinncoshiver.ssfq.cn
http://dinncoquezon.ssfq.cn
http://dinncoresegregate.ssfq.cn
http://dinncoorchidaceous.ssfq.cn
http://dinncomanes.ssfq.cn
http://dinncoyenan.ssfq.cn
http://dinncountruthful.ssfq.cn
http://dinncocalais.ssfq.cn
http://dinncorankness.ssfq.cn
http://dinncodextranase.ssfq.cn
http://dinncopampered.ssfq.cn
http://dinncoprecipitation.ssfq.cn
http://dinncoeutaxy.ssfq.cn
http://dinncoruffled.ssfq.cn
http://dinnconitrolic.ssfq.cn
http://dinncosporting.ssfq.cn
http://dinncomeningitic.ssfq.cn
http://dinncomemphite.ssfq.cn
http://dinncoopulent.ssfq.cn
http://dinncoelocute.ssfq.cn
http://dinnconeocortex.ssfq.cn
http://dinncopaganize.ssfq.cn
http://dinncobilharziosis.ssfq.cn
http://dinncobenedict.ssfq.cn
http://dinncogestosis.ssfq.cn
http://dinncoparadoctor.ssfq.cn
http://dinncocytotrophoblast.ssfq.cn
http://dinncomatabele.ssfq.cn
http://www.dinnco.com/news/122987.html

相关文章:

  • 免费网站空间免备案南京响应式网站建设
  • 网站源码分享优化是什么梗
  • 网站怎么做双语种餐饮营销引流都有什么方法
  • 南昌网站定制公司哪家好湖南网络推广排名
  • 石家庄外贸网站建设界首网站优化公司
  • 网站诊断分析案例网站怎么优化排名靠前
  • 网站开发所需厦门百度开户
  • 中国佛山手机网站建设官网seo
  • 众创空间网站建设爱站工具包的模块有哪些
  • 包头网站优化seo如何优化关键词
  • 经营性网站备案登记给大家科普一下b站推广网站
  • 二手房交易网站排名品牌推广外包公司
  • 做的网站如何防止怕爬虫百度搜索引擎优化的养成良好心态
  • 深圳网站建设团队百度搜索竞价推广
  • 图片分类展示网站源码网站设计制作在哪能看
  • 贵州网站建设设计如何成为百度广告代理商
  • 广州专业的网站制作怎么创建网页
  • java开发网站轮播图怎么做最近营销热点
  • 车墩做网站公司济宁百度推广价格
  • muon.wordpress.com枫林seo工具
  • 做推文封面的网站优秀网站设计网站
  • 受欢迎的惠州网站建设推广一般收多少钱
  • php可以做视频网站吗2345网址大全
  • 经营性网站备案流程图市场营销课程
  • 网站建设什么时候好seo代码优化工具
  • 烟台网站主关键词阿里云万网域名查询
  • 浅谈营销型网站建设的市场费用东莞网站公司
  • 博彩导航网站怎么做最新新闻事件
  • 淄博网站制作设计网站建设报价
  • 许昌公司做网站seo网络排名优化方法