梅涛院士做客STIM²讲堂:拆解生成式人工智能技术发展与挑战

图片

近日,STIM²讲堂第21期活动圆满举行。本期讲堂以“生成式人工智能技术发展与挑战”为主题,邀请智象未来创始人兼首席执行官、加拿大工程院外籍院士梅涛博士担任主讲嘉宾。活动吸引了校内外师生、校友、企业家及业界人士两百余人参加,本次活动由科技商学院特任教授姚加权老师主持。

图片

叶强 中国科学技术大学科技商学院、管理学院执行院长,国际金融研究院院长

活动伊始,科技商学院执行院长叶强教授致辞。他回顾了STIM²讲堂在推动科技、产业、投资与管理融合方面的平台作用,并强调在管理学院成立30周年之际,聚焦人工智能这一前沿领域具有重要意义。叶院长指出,生成式AI正深刻改变知识生产、商业逻辑与创新范式,科技商学院将持续聚焦AI与商业教育的深度融合,培养面向未来的“五懂”复合型人才。

图片

梅涛 智象未来(HiDream.ai)创始人兼首席执行官、加拿大工程院外籍院士

在主题分享环节,梅涛院士以《生成式人工智能技术发展与挑战》为题,进行了系统阐述。他从AI的技术演进、全球格局、产业实践及未来趋势等多个维度展开论述。

时代坐标

当前,AI正从“感知理解”迈向“理解创造”的新阶段。梅院士指出,业界对“人类级AI”的认知呈现光谱差异,这恰恰说明该领域仍处于充满可能的早期。他认为,我们正站在智能革命进入“深水区”的时代坐标上,AI时代构建的“GPU+算力中心+大模型+智能体”新范式可能带来百倍级生产力跃升,并进一步指出了AI赋能的两大方向:一是“传统行业+AI”实现降本增效与价值重构;二是“AI+新兴赛道”催生数字创意、自动驾驶等万亿级市场。

技术路径

在技术层面,梅院士剖析了从感知智能到认知智能的跃迁。他阐释了通往通用人工智能(AGI)的三条路径:以大语言模型为代表的文本路径、以多模态生成模型为代表的视觉路径,以及融合动作交互的具身智能路径。智象未来专注视觉路径,致力于以像素为单元模拟世界。技术演进正从“学知识”“学行为”转向“学思考”“学做事”的推理与智能体阶段发展,终极目标是构建理解世界本质的“世界模型”。现场展示的AI生成音乐视频案例生动印证了这一趋势——一段基于诗歌的多语种音乐视频,仅用不到三天便完成传统流程数月工作,凸显了AI提升效率、降低创作门槛的巨大潜力。

内外格局

全球格局上,中美形成“双引擎”引领态势,但路径分化明显:美国属“技术深度主导型”,凭借顶尖人才、高端芯片与超大算力在原创技术上领先;中国则为“场景广度驱动型”,依托丰富应用生态、工程师红利与开源策略,在产业化落地方面快速推进。他特别指出,安徽省凭借突出的科教资源与算力布局,AI产业已进入全国第二梯队头部。在安徽,以科大讯飞(大语言模型)和智象未来(多模态模型)为代表的“人工智能双子星”正形成协同,加速AI与本地产业融合。

产业实践

结合智象未来实践,梅院士深入阐释了生成式AI的落地逻辑。他介绍,公司具备“多模态生成与理解”双模能力,其开源图像模型曾登顶全球权威榜单。自主研发的多模态大模型HiDream-I1开源模型及视频生成平台vivago 3.0,通过“1+4+N”的商业化布局,将在电商营销、影视短剧、广告生成等领域带来“一人可抵十人”的效率变革,深刻影响企业组织与商业模式。

未来方向

展望未来,梅涛强调多模态大模型是通往AGI的必经之路,它比单一模态能更好地模拟物理世界,目标是构建融合物理规律与因果关系的世界模型。他表示,智象未来将继续依托安徽科创土壤,聚焦AI+商贸、AI+影视文旅等场景,通过产学研协同,为发展新质生产力贡献力量。整场分享融汇全球视野、技术洞见与产业实践,清晰展现了生成式AI的技术图谱、竞争态势与应用前景。

图片

图片

在问答环节,与会者就AI幻觉、版权归属、伦理治理等现实问题与梅涛院士展开深入交流。梅院士坦言,生成式AI在版权合规、内容可控性、价值对齐等方面仍面临诸多挑战,需要技术、产业、法律与社会多元协同。他提倡“分布式治理”理念,鼓励企业在发展中主动建立自律机制,在创新与规范间寻求平衡。

本次讲堂作为中国科大管理学院30周年系列活动之一,不仅呈现了生成式人工智能的技术前沿与商业图景,也为科学家、企业家与创业者搭建了深度对话的平台,凸显了学院在探索科技创新与产业融合方面的重要实践。未来,STIM²讲堂将持续聚焦科技与商业交叉领域,邀请更多学界与业界专家,探讨未来产业变革与创新机遇。