词元经济发展,不能止于数据规模
科技日报| 2026-05-11 09:28:06

  近来,“词元”(Token)在互联网上频频“出圈”,对“词元经济”的讨论热度也持续不减。日前发布的《全国数据资源调查报告(2025年)》显示,2025年全国年度数据生产总量达52.26泽字节(ZB),全球占比超27%;词元调用量约21100万亿,呈指数级增长。

  所谓词元,是人工智能大模型处理信息的基本单元。它可以是单个汉字、标点符号,或一个词语片段。我们每次向人工智能大模型提问,以及大模型生成的文字、图片或视频等,都离不开词元的调用和运算。而词元经济,则是指在人工智能领域,围绕词元的生产、调用、分发与结算所衍生形成的新型经济形态。

  可以说,词元正成为人工智能产业发展的“晴雨表”。词元调用量的不断攀升,充分彰显了我国人工智能产业欣欣向荣的发展态势。“养龙虾”全网爆火,让人们切身感受到人工智能不仅会“聊天”,还能“干活”;DeepSeek-V4预览版本正式上线并同步开源,关键性能指标达到国内外领先水平;豆包大模型披露付费计划,尝试在免费版的基础上,推出包含更多增值服务的付费版本,打开国产大模型“价值变现”的商业化想象空间……

  当前,我国词元经济发展方兴未艾,但也面临诸多挑战。比如,在高端制造、金融投资等对精度和可靠性要求严苛的专业领域,从词元数据质量到模型推理过程,国产人工智能大模型的表现还“欠些火候”;“数据孤岛”现象依然存在,公共数据开发利用处于起步阶段,高质量数据集短缺,数据要素流通仍需“拆墙铺路”;利用人工智能大模型生成虚假信息、侵犯版权及肖像权等乱象层出不穷,亟须监管为其“套上缰绳”;人工智能大模型的商业模式尚在探索,清晰且可持续的“生意经”仍待市场验证。

  充分激发词元经济活力,关键在于找准制约词元价值释放的瓶颈所在,精准发力、协同推进,构建起良好的词元经济生态。例如,突破核心算法等方面的技术短板,助力国产大模型在更多实际应用场景中“落地生根”;打破“数据孤岛”,让数据要素更高效地“跑起来”;健全人工智能和数据安全领域的政策法规,为词元的生成、流转及交易划好“红线”;打通大模型商业价值闭环,培育“模型即服务”“智能体即服务”等新业态,实现技术创新与商业模式创新“双向奔赴”。

  推动词元经济健康发展,不应止步于词元规模的快速增长,更应着眼于发展质效的全面提升。唯有系统破解词元经济发展面临的堵点,充分释放数据要素的价值潜力,方能夯实我国人工智能产业高质量发展的根基。

精彩推荐
张健工商资本下乡不能偏离 改善社会资本进入的基础环境
05-19
复制一批特斯拉项目 让“特斯拉速度”成为“上海速度”常态
05-18
猪肉价格真的降了 下半年逐步达到正常的水准是有可能的
05-11
大众公布在华销量 推进产品攻势 提供多样化、年轻化的选择
04-20
高江涛掌权斯威汽车 推出“预售抢购模式”及“两级火箭渠道模式”
04-20
美国消费数据创历史最糟纪录 未来股市可能会大幅下跌
04-17
热点推荐
五六天后:科学减脂 专业营养师团队为您的健康“保驾护航”
06-08
谜茵焕肤精华:开启非入侵式医美级护肤体验
06-08
草本与咖啡的结合——品晟咖啡强势登场
06-08
艾德证券港股打新京东|大有机会博10%的收益,来不来?
06-08
福鼎白牡丹对女人的具体好处有哪些?
06-08
TMALL@HOME 天猫家居生活展亮相上海K11,用脑洞致敬生活!
06-08