百科创建
39.8K
8109

词元(Token)

Token(中文名:词元)是计算机领域的数字标识符。在信息技术中,它作为随机字符串或加密数据块用于身份验证、安全访问控制,代表用户、设备或会话的授权信息,典型形式包括JSON Web Token (JWT)和OAuth Token。在自然语言处理中,Token作为最小文本处理单元,指字符或字符序列,是大型语言模型的输入输出基本单位。

身份验证类Token由服务器生成并发送至客户端,通过加密签名实现无状态认证,应用于单点登录及API访问控制。编程语法中Token作为关键字、运算符等基本单位,网络通信中则通过标识符实现分布式系统交互,人工智能领域将Token调用量作为衡量模型计算效能的核心指标。

截至2026年2月,中国日均Token消耗量达到180万亿级别,较2024年初的1000亿显著增长;2026年2月,中国大模型Token调用量首次超过美国,微软Azure云日均调用量在2025年6月底从0.55万亿提升至4.40万亿。全球日均Token消耗量过去两年增长近300倍,华为云Token服务通过弹性算力架构为AI内容生产提供底层支持,覆盖文本生成、图像合成等多模态场景,英特尔公司提出异构AI基础设施发展趋势,通过异构硬件架构、开放软件栈及先进封装技术应对智能体AI的Token调用复杂度增长。摩根大通预测中国AI推理Token消耗量将从2025年的约10千万亿增长至2030年的约3900千万亿。2026年3月,中国日均Token(词元)调用量超过140万亿,相比2024年初的1000亿增长了1000多倍,相比2025年底的100万亿,三个月时间又增长了40%多。

词元是大模型处理信息的最小信息单元,具有智能时代可计量、可定价、可交易的特征。当下,围绕词元的调用、分发与结算,一套新的价值体系正在加速演进形成,并成为人工智能产业商业化的重要路径。在人工智能领域,Tokens是文本AI理解和处理语言的基础单元,作为训练数据的信息片段和模型生成的输出内容。企业必须从Tokens的角度思考数据以构建生成能力,PayPal负责人工智能业务的高级副总裁Prakhar Mehrotra指出,每家公司都必须从Tokens的角度思考他们的数据,因为这样他们才能从中衍生出智能。

8109

免责声明:本站词条系由网友创建、编辑和维护,内容仅供参考。

以上内容均为商业内容展示,仅供参考,不具备专业问题解决服务,

如果您需要解决具体问题(尤其在法律、医学等领域),建议您咨询相关领域的专业人士。

如您发现词条内容涉嫌侵权,请通过 948026894@qq.com 与我们联系进行删除处理!

一秒推