数字人李白上线通义App，既能吟诗作对也可谈古论今

2024-09-10 14:36 由环球网发表于 #科技

【环球网科技综合报道】9月10日消息，通义宣布推出数字人李白，基于通义大模型打造，集合通义多模态技术实力，不仅在外貌上还原唐代诗人李白的中年形象，更在眼神、言谈举止间融入对李白诗词意境的理解与艺术再现。打开通义App，输入“李白”，便能和数字人李白开启一场即兴对话，既能吟诗作对，也可聊聊科技发展。

和需要大量视频作为训练数据，对真实人物进行复刻的传统数字人不同，通义推出的李白数字人，只需要一张图就可以生成具有全身动态的数字人，在这背后，是阿里通义大模型能力的“六剑客”。

大脑来自通义的模型Qwen，其语⾔理解、知识、代码、数学及多语⾔等多项能⼒显著领先。表情跟自然呼吸态来自EMO模型，最大化地保留模型创造力，使人脸表现力大大提升。肢体动作上，通义采用了强控制方法AnimateAnyone，用针对人体建模的骨架图片来驱动人物动作，也是曾爆火全网的“全民舞王”背后的技术。

语言模型来自通义语音实验室的CosyVoice技术，基于海量数据训练的生成式语音大模型，能够实现1-3句话声音克隆。为了让数字人有更好的实时对话能力，数字人李白还采用了VideoReTalking技术，它可以根据音频自动匹配嘴型。

未来，视觉语言大模型VL（Vision-Language）也将被应用在数字人交互领域，在情感识别、虚拟现实交互上提供更优质的互动体验。未来打开摄像头，用户便能与李白打破时空结界、体验身处一世的实时视频通话。

“李白是中国传统文化的一张名片，数字人李白让这位跨越千年的文学巨匠以全新的形态‘活’在当下，与全球观众互动，激发更多人对古典文学的兴趣与热爱。”通义数字人产品经理龙慧表示，未来，从线上教学到虚拟旅游，数字人将在教育、文化旅游、数字娱乐等多个领域展开广泛应用的计划。

提升iPhone 16首发体验：饿了么上线专人配送等定制化服务

9月10日一早，饿了么同步宣布：今年将携手近4000家Apple 授权专营店，支持iPhone 16新品预售及现货的同步开售阅读全文

青海海东：探访中国首个零碳数据中心

2024年9月9日，记者探访位于青海海东的中国电信（国家）数字青海绿色大数据中心阅读全文

人工智能专家张宏江任蚂蚁集团独立董事蚂蚁进一步加码AI战略

【环球网科技报道记者李文瑶】9月9日，记者获悉，蚂蚁集团召开股东大会，审议通过了增补董事会独立董事的议案，知名人工智能学者、北京智源研究院创始人、美国国家工阅读全文

清华大学孙茂松：智能体商业化进程仍面临诸多挑战

【环球网科技报道记者李文瑶】2024外滩大会期间，清华大学计算机科学与技术系长聘教授、清华大学人工智能研究院常务副院长、欧洲人文和自然科学院外籍院士孙茂松在阅读全文

亚马逊云科技：韧性是现代云服务至关重要的组成部分

对此，亚马逊云科技大中华区解决方案架构总经理代闻认为，韧性是现代云服务至关重要的组成部分阅读全文

今天，小米现任总裁卢伟冰发布微博，宣布小米即将首发“旗舰新平台”。新的旗舰平台采用了桌面级微架构，并带来了超高主频、超强性能、超低功耗的“三超特性”，对过去的产品而言是颠覆性的升级。同时，卢伟冰在微博中称，“经过三年深度联合研发，加上这次我们系统内核的全面优化，将会是有史以来最显着的一次性能体验跃升，芯片行业格局的拐点到了。”根据往年小米与高通的产品规律不难确认，这条微博提到的“新平台”为高通骁龙8 Gen4，而首发该处理器的产品则将是小米15系列。根据目前已知消息，骁龙8 Gen4将...阅读全文