4HD0IFyr33F作者:史安斌 朱泓宇opinion.huanqiu.comarticle史安斌 朱泓宇:“文生视频”竞争,“文”是基底,需夯实/e3pmub6h5/e3pr9baf6自OpenAI发布“文生视频”大模型Sora以来,这款被命名为“天空”(以日语汉字“空”的发音命名)的AI产品引爆了全球科技与传媒行业,继ChatGPT后再度掀起了文生视频AI研发浪潮,多种多样的生成路径内核其实殊途同归:高质量的复杂文生视频,离不开大文本、高密度的信息。现代世界,大国竞争早已不局限于物理时空而进入网络空间。对人工智能等前沿技术的掌握与应用,很大程度上反映着国家的综合实力。彰显文化与传播软实力也不仅仅依靠传统媒体与初代互联网的渠道,而是愈发依赖数智媒体技术与人机交互水平的创新迭代。以“天空”为代表的西方新一代文生视频智能技术,纵然蕴含着对无限创作可能与广阔应用场景的美好期待,但也同样为后发国家的同类大模型敲响警钟:这一虚拟“天空”究竟是“谁的天空”,其内核是否充斥着单一语言与文明排他性的“阴霾”?万变不离其宗,文生视频,视频是结果,“文”才是基底。就全球主流产品而言,无论是已蔚然成风的文本生成类大语言模型,还是初露端倪的文生视频人工智能程序,其背后的主导语言文化仍是英语及其“盎撒”文明。以OpenAI等为代表的技术领头羊,算法模型使用的仍是以英语为主要语言的互联网数据集、美英等主流媒体新闻库、社交媒体平台内容、书籍库和英文维基百科网站等。其中,不少信息貌似客观的外衣下,包含着西方中心主义的政治偏见、虚假信息与文化价值观,而中文及中华文化主动输出的素材占比不到一成。这无疑会给中文信息与中华文化的国际传播造成讲不开、传不出、易误读的“困境”。如何打响新一轮的“天空”争夺战,在文生视频领域继续开拓更新,实现这一领域“新质生产力”的突破,将成为赋能文化软实力新的增长点。要想在AI赛道上获得“超车”机会,业界要在寻找技术新“奇点”的同时,夯实其所嵌入的语言与文化的基底逻辑。 中国文生视频的真正挑战与应对策略在于,如何将中华优秀传统文化、思想文明精粹转化为中国国产大模型与文生视频软件的基础语言与价值内核,夯实“文”的基底。在模型训练和数据集构建过程中,需要首先训练、使用大量本土化的中文数据与文化符码,以确保模型对中文语言的理解和生成能力具有优异表现。其次,引入契合中文与中华文化的自适应学习和生成机制,根据海量中文用户的反馈和需求,不断优化产品体验,使其更符合海内外用户的个性化需求;进而实现多模态的中文语言理解和视频生成能力,推动大模型在不同领域的应用和发展,亦要兼顾好“人本创意”与“AI转译”之间的微妙关系。此前,首部国产文生视频AI动画片《千秋诗颂》的启播引发了小范围的热烈讨论。该动画作品汇编了《春夜喜雨》等诗词,运用AI技术将统编教材转化为“国风动画”,开辟出一片具有中华文化色彩的“新天地”,为基础教育赋予生机活力,增强国民文化自信,助力相关诗词作品的现代演绎与国际传播。尽管部分评论对动画的画质与细节处理提出“质疑”,但结合古典诗词与传统文化的AI“初尝试”标志着国产文生视频产业已迈出了第一步。放眼未来,更多相关的优质应用必将涌现。在国产人工智能不断“上台阶”“接地气”的过程中,伴随多语言、跨语言指令技术与编码系统的更新,中华文化与中文语言逻辑将助力这批“文生视频”应用更好承载相应文明样态,进而丰富世界文明百花园,让数智传播的“天空”更加绚烂夺目。(作者分别是清华大学新闻与传播学院教授、爱泼斯坦对外传播研究中心主任,清华大学新闻与传播学院博士研究生)1711925217319环球网版权作品,未经书面授权,严禁转载或镜像,违者将被追究法律责任。责编:肖山环球时报171192521731911[]{"email":"xiaoshan@huanqiu.com","name":"肖山"}
自OpenAI发布“文生视频”大模型Sora以来,这款被命名为“天空”(以日语汉字“空”的发音命名)的AI产品引爆了全球科技与传媒行业,继ChatGPT后再度掀起了文生视频AI研发浪潮,多种多样的生成路径内核其实殊途同归:高质量的复杂文生视频,离不开大文本、高密度的信息。现代世界,大国竞争早已不局限于物理时空而进入网络空间。对人工智能等前沿技术的掌握与应用,很大程度上反映着国家的综合实力。彰显文化与传播软实力也不仅仅依靠传统媒体与初代互联网的渠道,而是愈发依赖数智媒体技术与人机交互水平的创新迭代。以“天空”为代表的西方新一代文生视频智能技术,纵然蕴含着对无限创作可能与广阔应用场景的美好期待,但也同样为后发国家的同类大模型敲响警钟:这一虚拟“天空”究竟是“谁的天空”,其内核是否充斥着单一语言与文明排他性的“阴霾”?万变不离其宗,文生视频,视频是结果,“文”才是基底。就全球主流产品而言,无论是已蔚然成风的文本生成类大语言模型,还是初露端倪的文生视频人工智能程序,其背后的主导语言文化仍是英语及其“盎撒”文明。以OpenAI等为代表的技术领头羊,算法模型使用的仍是以英语为主要语言的互联网数据集、美英等主流媒体新闻库、社交媒体平台内容、书籍库和英文维基百科网站等。其中,不少信息貌似客观的外衣下,包含着西方中心主义的政治偏见、虚假信息与文化价值观,而中文及中华文化主动输出的素材占比不到一成。这无疑会给中文信息与中华文化的国际传播造成讲不开、传不出、易误读的“困境”。如何打响新一轮的“天空”争夺战,在文生视频领域继续开拓更新,实现这一领域“新质生产力”的突破,将成为赋能文化软实力新的增长点。要想在AI赛道上获得“超车”机会,业界要在寻找技术新“奇点”的同时,夯实其所嵌入的语言与文化的基底逻辑。 中国文生视频的真正挑战与应对策略在于,如何将中华优秀传统文化、思想文明精粹转化为中国国产大模型与文生视频软件的基础语言与价值内核,夯实“文”的基底。在模型训练和数据集构建过程中,需要首先训练、使用大量本土化的中文数据与文化符码,以确保模型对中文语言的理解和生成能力具有优异表现。其次,引入契合中文与中华文化的自适应学习和生成机制,根据海量中文用户的反馈和需求,不断优化产品体验,使其更符合海内外用户的个性化需求;进而实现多模态的中文语言理解和视频生成能力,推动大模型在不同领域的应用和发展,亦要兼顾好“人本创意”与“AI转译”之间的微妙关系。此前,首部国产文生视频AI动画片《千秋诗颂》的启播引发了小范围的热烈讨论。该动画作品汇编了《春夜喜雨》等诗词,运用AI技术将统编教材转化为“国风动画”,开辟出一片具有中华文化色彩的“新天地”,为基础教育赋予生机活力,增强国民文化自信,助力相关诗词作品的现代演绎与国际传播。尽管部分评论对动画的画质与细节处理提出“质疑”,但结合古典诗词与传统文化的AI“初尝试”标志着国产文生视频产业已迈出了第一步。放眼未来,更多相关的优质应用必将涌现。在国产人工智能不断“上台阶”“接地气”的过程中,伴随多语言、跨语言指令技术与编码系统的更新,中华文化与中文语言逻辑将助力这批“文生视频”应用更好承载相应文明样态,进而丰富世界文明百花园,让数智传播的“天空”更加绚烂夺目。(作者分别是清华大学新闻与传播学院教授、爱泼斯坦对外传播研究中心主任,清华大学新闻与传播学院博士研究生)