时间:2025-07-29 23:48 作者:王大忽悠
WAIC 2025观察:昇腾助力AI融入多元化生活场景
AI的价值在哪里?
刚刚结束的WAIC 2025上,问题的答案越来越具象化。
站在产业的视角,AI正在重塑企业的组织、生产与价值链。知名市场调研机构埃森哲的报告显示,69%的企业高管计划在18个月内完成核心业务的AI化重构,AI已经从可选项变为战略必选项。
而作为一个普通用户,我们的生活也在被AI潜移默化地改变。比如在WAIC 2025的昇腾AI展区,从AI即时通讯、AI图像生成到AI声音克隆、AI数据分类,连尚集团深刻诠释了AI和生活场景的融合。
在技术和应用的“碰撞”中,AI不再只是“生产力”,同时也是生活化场景向智能演进的“催化剂”。
01 被大模型释放的“想象力”
在WAIC 2025上,我们看到了一个流行趋势——以“对话”为核心的AI互动,不再局限于独立的情感陪伴类产品,而是渗透进即时通讯、健康咨询、教育辅导等场景,营造出了差异化的用户体验。
直接的例子就是口信APP,融合了即时通讯、互动交友、AI智能人、数字元宇宙等功能,重构了AI即时通讯的产品形态。特别是“AI智能人”的功能,给我们留下了两个深刻印象:
第一个是千人千面的生命感。
“AI智能人”不是设定好的剧本,而是像真人一样有情绪、有三观、有记忆,也会接受外界的时事政治、经济环境、体育娱乐等信息,不断影响TA的观点和性格,甚至有自己的生活和行程安排。
和电影《Her》的设定相似,“AI智能人”和用户的关系将随着亲密度的变化与关系的变化,聊天话题的范围和内容也会有明显的差别。
第二个是无穷无尽的创造力。
“AI智能人”被赋予了内容整合和创作的能力,在和用户沟通的过程中,不再是“套路式”的对话,而是深刻理解用户的诉求,进而扮演不同的角色,陪用户聊股票、聊新闻等等,满足了个性化定制的需求。
一个有趣的细节在于,“AI智能人”会像真人一样发布自己的动态,阅读和评论用户的动态,乃至向用户“求安慰”。
社交通讯只是日常生活的一面,除了有生命感的“AI智能人”,我们在昇腾AI展区看到了更多被AI改变的生活场景。
比如融合了AI声音克隆和内容生成能力的“爸爸讲故事”,可以克隆家人的声音,生成专属的故事视频;
整合了图像生成、换脸技术的脸趣FaceFun,帮用户打造了专属的“私家写真照相馆”,每个人都能得到属于自己的视觉大片;
以及AI赋能的NAS产品GEAK智慧云,可以通过人脸识别自动分类照片,并生成对应的人物相册,更为便捷的是,直接输入关键词就能搜索出相应的照片。
看似微小的体验革新,恰恰是AI落地的真正拐点:正在从“前沿技术”走向“生活基础设施”,原本只有专业人士才能完成的工作,现在“有AI就够了”。AI的价值不在别处,在于让“美好”成为生活的常态。
02 跨越“鸿沟”的技术路径
为什么现阶段的AI还未走进大多数人的生活?因为在落地过程中存在两个绕不过的痛点:
一个是时延,动辄几秒的内容生成时间,让对话变得“卡顿”,语气再自然、表情再丰富,也难掩那种“等一等”的生硬。让人始终意识到:对面是台机器,而不是一个随时回应、充满情绪张力的“人”。
另一个是上下文的限制,当前AI的“记忆“主要依赖上下文窗口,一旦聊天稍长一些、话题略微跳跃,AI就容易出现“健忘”的现象——前面刚刚提到的名字、情绪、偏好或细节,后面就被“遗忘”了。
在人机对话的语境下,高时延、低连贯性产生的割裂感,不仅削弱了对话的流畅度,也很难让用户建立起“被理解”的信任感。想要构建连续、细腻、可信赖的对话,必须要在技术上跨越鸿沟。
针对以上两个痛点,昇腾提供的大EP+PD分离方案给出了解决路径。
大模型的推理过程可以拆解为两个阶段:第一个阶段是预填充(Prefill),处理用户的输入并生成初始KV缓存,就像人聊天前要先把对方说的话听清楚、理解透;第二个阶段是解码(Decode),负责后续Token的生成,可以理解为一字一句的回答。
在传统的串行推理中,需要先执行预填充,再进行解码,经常会出现Prefill阶段“忙得飞起”,Decode阶段“干等闲耗”的现象。就像一场会议,主持人一直在准备PPT,发言人却只能在一旁等着。
昇腾的大EP方案实现了PD分离部署,即将Prefill和Decode阶段部署到不同的服务器上,分别作为P实例和D实例,并通过高速互联网络传输KV缓存等中间数据,在不同的服务器上同时进行预填充和解码。相当于开会时让“准备”和“发言”同步进行,极大地降低了时延,提高了资源利用率。
如果灵活性要求比较高,昇腾还实现了AutoPD分离部署,能够自动感知负载变化,无需人工介入即可自动伸缩P、D实例:需要计算密集型任务时,调拨更多P实例资源,需要应对访存密集型需求,则同步扩展D实例。打个比方的话,就是根据不同时段的交通流量,自动调整道路的通行方式。
可以佐证的是,昇腾通过64卡并行推理,达到了最低50ms的低时延和更高E2E吞吐,并且可支持128K超长序列,最终POC实测吞吐性能是业界传统方案的1.29倍。
折射到产品体验上,有了坚实的软硬件基础设施作为支撑,口信APP里的“AI智能人”化身成了“随问随答、能记得你上周说过的话,能懂你今天不一样的心情”的智能伙伴。
03 技术和应用的螺旋进化
技术创新的终点,不是追求算力上的极限,也不是参数堆砌的模型竞赛,而是在场景中打造更温暖的体验。
正如口信APP场景下昇腾的技术适配与探索:改变世界的AI,不在研究院,而在你我的日常生活中。技术从不抽象,正在加速生活化场景落地,就像“会陪你说话、懂你情绪的虚拟朋友”。
诸如此类的创新还有很多。
比如“爸爸讲故事”生成故事视频的场景中,涉及到文本生成、图片生成、语音克隆等环节,需要良好的时序理解与统一调度能力。昇腾将视频生成的速度提升20%,省下等待时间,把爱留给陪伴。
比如脸趣FaceFun的图像生成,昇腾重新定义了“体验感”,让图片生成的速度从分钟级压缩到了秒级,无论是工业风的酷飒、暗黑哥特的神秘、美式校园的青春,还是胶片撕拉片的复古质感,都无需等待。
再比如GEAK智慧云的智能分类和搜索场景,昇腾软硬件提供可高精度、高性能的推理服务,有效提升了数据处理的准确率与响应速度,实现了更加精准、高效的数据分类与检索能力,让“回忆”更清晰。
据了解,业界已经基于昇腾适配和开发超过80个大模型,在基础大模型方面多个技术方向均有积累;超过2700个行业伙伴,基于昇腾孵化了超过6000个解决方案,在千行万业的落地中拓展AI的应用边界,不断壮大中国的AI产业生态。
背后所揭示的,其实是技术和应用的协同进化:技术上的联合创新一次次打破边界,层层叠加地提升了应用体验的上限;应用侧不断衍生的新需求,又反过来驱动技术层面的持续迭代和升级,最终形成螺旋式创新的正循环,让技术更懂场景,让场景更有想象空间。
把视角再放大一些的话,昇腾和伙伴们的生态合作,正加速推动AI产业链的上下游协同,通过更广泛的技术开放和更精细化的行业落地,证明了中国AI技术在全球舞台上的竞争力。
正如WAIC 2025发生的一幕:大大小小的应用厂商正在内容创作、智能社交、效率工具等品类落子,加速AI在生活场景的落地;来自教育、金融、政务、医疗等行业的一线企业,均已将AI融入业务主链,作为驱动新质生产力的核心引擎……
一场席卷千行万业、和每个人的生活密切相关的场景革命愈演愈烈。
1、深刻把握和认真践行人民城市理念(深入学习贯彻习近平新时代中国特色社会主义思想·原创性概念标识性概念纵横谈)
2、冯骥推荐看《南京照相馆》:没有犹豫,没有矫饰,没有抒情,只有血淋淋的事实
3、阿尔马达:毫不犹豫选择马竞,接下来我要证明我的价值,阿尔马尔竞品