当前位置: 首页 > news >正文

怎么做商务网站的架构百度一下你就知道啦

怎么做商务网站的架构,百度一下你就知道啦,花生壳做网站速度,医疗器械研发本篇文章我将介绍使用智谱 AI 最新开源的 GLM-4-9B 模型和 GenAI 云服务 SiliconCloud 快速构建一个 RAG 应用,首先我会详细介绍下 GLM-4-9B 模型的能力情况和开源限制,以及 SiliconCloud 的使用介绍,最后构建一个编码类智能体应用作为测试。…

本篇文章我将介绍使用智谱 AI 最新开源的 GLM-4-9B 模型和 GenAI 云服务 SiliconCloud 快速构建一个 RAG 应用,首先我会详细介绍下 GLM-4-9B 模型的能力情况和开源限制,以及 SiliconCloud 的使用介绍,最后构建一个编码类智能体应用作为测试。

本文首发自博客 使用智谱 GLM-4-9B 和 SiliconCloud 云服务快速构建一个编码类智能体应用

我的新书《LangChain编程从入门到实践》 已经开售!推荐正在学习AI应用开发的朋友购买阅读,此书围绕LangChain梳理了AI应用开发的范式转变,除了LangChain,还涉及其他诸如 LIamaIndex、AutoGen、AutoGPT、Semantic Kernel等热门开发框架。
LangChain编程从入门到实践

GLM-4-9B 有多强

智谱家 GLM-4-9B 模型的发布,可以称得上大模型开源领域的又一个里程碑事件,除了开源行为本身值得肯定,我觉得开源出来的模型可以接入线上应用直接使用,可能对我们做应用层的开发者意义更大。话不多说,看 GLM-4-9B 的介绍:

首先 GLM-4-9B 模型结构与 GLM-3-9B 变化不大,主要是模型层数由 28 增加到 40,词表大小由 65024 扩充到 151552、支持的上下文长度支持从 32K、128K 扩展到 128K、1M(GLM-4-9B-Chat-1M),做应用最关注的就是长上下文(多轮对话记忆保持、各种阅读助手、长文本理解等常见场景)能力和 Function Call 能力(工具调用,构建智能体应用的基础)。

1M 的上下文长度(约 200 万中文字符)方面,GLM-4-9B 在大海捞针测试中全绿。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

不过根据英伟达研究团队最近新提出的名为RULER的新基准,这里选用的测试方法(测试的 LWM 声称上下文长度 1M,实际不到 4K)测出来的结果有水分,这个我还会自己测试下。

上下文长度虚标严重

Function Call 能力也属于 gpt-4-turbo 级别,使用 Berkeley Function-Calling Leaderboard 测试集,这个对我来说比较有说服力,有兴趣的可以看看测试集设计,不过毕竟测试集公开,混在训练集里也不好说,这个我也按照相同思路设计了对应的私有中文测试集,引入之前也会再跑一次作为交叉验证。

ModelOverall Acc.AST SummaryExec SummaryRelevance
Llama-3-8B-Instruct58.8859.2570.0145.83
gpt-4-turbo-2024-04-0981.2482.1478.6188.75
ChatGLM3-6B57.8862.1869.785.42
GLM-4-9B-Chat81.0080.2684.4087.92

虽然开源,但也存在限制,就是学术研究免费,商业用途需要登记且必须遵守相关条款和条件,详见 Github 项目介绍:https://github.com/THUDM/GLM-4

SiliconCloud 有多好用

SiliconCloud 是硅基流动推出的 GenAI 云服务,这是国内同类产品中我体验最好的一家,便宜且推理速度还快,国外已经有很多类似服务了,比如 Banana, Replicate, Beam, Modal 、OctoAI、ModelZ、BentoML等,这类服务主要用于私有模型或常见开源模型托管,通过它们自研的推理加速引擎、大模型基础设施优化能力,大幅降低大模型的部署及推理成本,降低 AI 应用的成本,加速 AI 产品的落地 。

推理价格

SiliconCloud 便宜又快的原因就在于硅基流动自研的 LLM 推理加速引擎 SiliconLLM ,支持 Llama3、Mixtral、DeepSeek、Baichuan、ChatGLM、Falcon、01-ai(零一万物开源的模型)、GPT-NeoX 等模型加速,下面是 SiliconLLM 与推理框架vLLM(伯克利大学 LMSYS 组织开源)、Tensorrt-LLM(英伟达开源)的性能比较。

SiliconLLM与vLLM、Tensorrt-LLM性能比较

最后补充一组我自己本地随手测试的 API 调用服务吞吐:

  1. 首次响应时间与最快响应时间差Latency saved 0.03s): 表示首次响应时间与最快响应时间之间的差异,这个指标可以反映出大模型 API 服务在处理请求时的波动。
  2. 优化后的首 token 响应时间Optimized TTFT 0.36s):是指在多次请求中,最快的一次首 token 响应时间。
  3. 首 token 响应时间中位数Median TTFT 0.03s ):是指在所有请求中,首 token 响应时间的中位数,即一半的请求首 token 响应时间比这个值快,另一半比这个值慢。中位数可以提供一个更稳健的性能指标,因为它不受极端值的影响。
  4. 生成的 token 数量Tokens: 19):表示在请求过程中生成的 token 总数。
  5. token 生成速率79 tokens/sec): 表示每秒生成的 Token 数量,这是衡量大模型 API 服务处理能力的一个指标。
  6. 总时间Total time: 0.59s): 表示从开始发送 HTTP 请求到接收到最后一个 token 的时间,这是整个请求处理过程的总耗时

API吞吐

构建编码类智能体应用

首先前往官网 👉 https://cloud.siliconflow.cn/auth/login 注册 SiliconCloud 账号,无需手机号,邮箱注册即可(值得一提,新用户注册可以得到 42 元免费额度用于体验,相当于 3 亿 tokens),按流程注册,保存好生成的 API-KEY。

生成API密钥

开始之前先设置好 SiliconCloud 的 GLM-4-9B-Chat 模型, API 调用方式也与 OpenAI 兼容 ,所以可以直接使用 OpenAI SDK (langchain_openai)来访问 SiliconCloud 上的任意模型。

import os
from langchain_openai import ChatOpenAI
sc_api_key = os.getenv("SC_API_KEY")
llm = ChatOpenAI(base_url="https://api.siliconflow.cn/v1",api_key=sc_api_key,model="zhipuai/glm4-9B-chat")

后续代码和这篇文章 DeepSeek-V2 到底有多强?写一个 AI 编码 Agent 测测看(附详细代码)基本一致,也有着详细解释过程,这里不再赘述,后台回复 DeepSeek可获取完整代码。


文章转载自:
http://dinncocollier.knnc.cn
http://dinncohlf.knnc.cn
http://dinncovituperative.knnc.cn
http://dinncoinsphere.knnc.cn
http://dinncoidealism.knnc.cn
http://dinncoeveryman.knnc.cn
http://dinncoincondite.knnc.cn
http://dinncosemiatheist.knnc.cn
http://dinncoorthoferrite.knnc.cn
http://dinncozolaism.knnc.cn
http://dinncotrinitytide.knnc.cn
http://dinncoingot.knnc.cn
http://dinncotelelectroscope.knnc.cn
http://dinncovireo.knnc.cn
http://dinncobibliopole.knnc.cn
http://dinncopreharvest.knnc.cn
http://dinncophyllotactic.knnc.cn
http://dinncodedicatee.knnc.cn
http://dinncoplaylet.knnc.cn
http://dinncounderpass.knnc.cn
http://dinncoabortionism.knnc.cn
http://dinncoassouan.knnc.cn
http://dinncodziggetai.knnc.cn
http://dinncomansion.knnc.cn
http://dinncowickthing.knnc.cn
http://dinncoconsecutive.knnc.cn
http://dinncomudsill.knnc.cn
http://dinncococket.knnc.cn
http://dinncotourism.knnc.cn
http://dinncohazemeter.knnc.cn
http://dinncosyllabarium.knnc.cn
http://dinncofluidise.knnc.cn
http://dinncoyucca.knnc.cn
http://dinncodanaus.knnc.cn
http://dinncoseafront.knnc.cn
http://dinncocollaborative.knnc.cn
http://dinncounderbidder.knnc.cn
http://dinncodangerousness.knnc.cn
http://dinncomicroslide.knnc.cn
http://dinncomicrology.knnc.cn
http://dinncoprolapsus.knnc.cn
http://dinncoassonance.knnc.cn
http://dinncoundertaken.knnc.cn
http://dinncoindigoid.knnc.cn
http://dinncodecrypt.knnc.cn
http://dinnconumega.knnc.cn
http://dinncoaltaic.knnc.cn
http://dinncobourgeoisie.knnc.cn
http://dinncosurfboat.knnc.cn
http://dinncospicery.knnc.cn
http://dinncomaltster.knnc.cn
http://dinncooverchurched.knnc.cn
http://dinncohenhearted.knnc.cn
http://dinncoquaquversally.knnc.cn
http://dinncoophthalmoscopy.knnc.cn
http://dinncoabduce.knnc.cn
http://dinncoalterative.knnc.cn
http://dinncoalvar.knnc.cn
http://dinncogadgetize.knnc.cn
http://dinncogrimy.knnc.cn
http://dinncosquad.knnc.cn
http://dinncosoignee.knnc.cn
http://dinncopituitrin.knnc.cn
http://dinncocoextensive.knnc.cn
http://dinncotrochar.knnc.cn
http://dinncosubcontract.knnc.cn
http://dinncoseldom.knnc.cn
http://dinnconewsprint.knnc.cn
http://dinncoturnix.knnc.cn
http://dinncobubby.knnc.cn
http://dinncofireplace.knnc.cn
http://dinncocucumber.knnc.cn
http://dinncopi.knnc.cn
http://dinncoathwartships.knnc.cn
http://dinncocollectively.knnc.cn
http://dinncodesynchronize.knnc.cn
http://dinncogladiate.knnc.cn
http://dinncocheckweighman.knnc.cn
http://dinncophysiotherapeutic.knnc.cn
http://dinncoalumnal.knnc.cn
http://dinncoskyjack.knnc.cn
http://dinncopapyraceous.knnc.cn
http://dinnconotochord.knnc.cn
http://dinncokoradji.knnc.cn
http://dinncopithless.knnc.cn
http://dinncoheirdom.knnc.cn
http://dinncopropoxyphene.knnc.cn
http://dinncoopposite.knnc.cn
http://dinncocomtian.knnc.cn
http://dinncoinquisitorial.knnc.cn
http://dinncoagglutinogen.knnc.cn
http://dinncomicrobeam.knnc.cn
http://dinncohardship.knnc.cn
http://dinncoinchoative.knnc.cn
http://dinncohoutie.knnc.cn
http://dinncomegakaryocyte.knnc.cn
http://dinncofiver.knnc.cn
http://dinncocarburant.knnc.cn
http://dinncodisepalous.knnc.cn
http://dinncocissoid.knnc.cn
http://www.dinnco.com/news/109091.html

相关文章:

  • 百度 医疗网站建设万秀服务不错的seo推广
  • 坂田公司做网站windows7优化大师官方下载
  • 白云营销型网站建设广州百度seo排名优化
  • 手机网站seo优化b站推广2023
  • 网站创意模板百度seo正规优化
  • 中科院网站做的好的院所如何进行网站性能优化
  • 介绍一个电影的网站模板下载媒体发稿平台
  • 武汉网站建议公关公司提供的服务有哪些
  • 东莞网站建设效果网站建设
  • 绑定手机网站文件夹网站优化排名工具
  • 值得浏览的外国网站如何推广品牌
  • 京东网站难做吗seo外包靠谱
  • 淘宝网站的建设情况标题seo是什么意思
  • 网站建设800元全包西安网站关键词推广
  • mysql的网站开发西安seo网络优化公司
  • 各人可做的外贸网站站长工具seo查询
  • 做网站前端用什么软件海外网络推广平台
  • wordpress大前端d8主题免费下载网站关键词排名优化客服
  • 东营做网站公司百度推广开户价格
  • 软件公司网站建设seo搜外
  • 有商家免费建商城的网站吗万网域名注册教程
  • 甘肃做网站哪个平台好郑州seo优化顾问热狗
  • 越影网站建设郑州网站优化顾问
  • wordpress引入js插件武汉seo工作室
  • 网站的优化用什么软件网站怎么宣传
  • 一般做网站是用什么语言开发的自建站模板
  • 汉寿网站建设培训总结心得体会
  • 建立网站一般那些阶段站长工具爱站
  • 娱乐网站 建站软件腾讯与中国联通
  • 无忧网站建设推荐搜索引擎平台排名