新眸原创·作者 | 鹿尧
上个月,2026世界数字教育大会在杭州开幕。中国美术学院作为大会“艺术与科技的共生共创”参访线路的展示窗口,向人们呈现了一堂别开生面的中国画实践课。
一间教室里,围了几圈人,内圈有一张铺了宣纸的桌子,美院教授正在画一幅《清廉二友图》,墨色在笔尖晕开。身后竖着的一块屏幕,有研究人员借助国画创作平台,在键盘上陆续敲出指令,不多久,一幅国画风格的图像出现在屏幕上。
这个场景有趣的地方在于:一边是毛笔与墨汁,一边是算法与算力,两种看起来毫不相干的工具,在同一场演示里完成了同一件事——创作一幅水墨画。
一场展示背后,是中国美术学院与火山引擎联合研发的“中国画智能体”。双方从启动到交付用了5个月,核心支撑是火山引擎提供的“高质量数据集”产品,以及围绕约数万张张中国画精品训练出的垂类模型。
在此之前,火山引擎的数据方案已服务过不少非标准化、非结构化的数据场景。而这次,数据变成了花鸟画,标签变成了笔墨、气韵、留白、章法,交付物变成了一个能鉴赏、能生成国画的AI。
一个专注AI的科技公司,一个聚焦艺术美学的美术学院,两边的结合,与其说是战略合作,不如说是在行业拐点上的一次自然碰撞。而碰撞的结果,还有一条可以复制的路径:让一个非技术背景的垂直行业,用自己的高质量数据,在大模型之上长出属于自己的AI能力。
01
数字化做了20年
但机器还是不懂国画
如果把艺术品数字化比作一条路,过去20多年,文博机构和艺术院校都在走:把画拍成高清图,扫描成数字文件,挂到网上。这条路没错,传播面确实广了,社会美育确实推进了。
但这只是“数智化”的前半段。后半段的“智”,一直很少有人走通。
国画的“皴法”“设色”“构图”“款识”“意境”这些概念,对于很多人来说已是“只可意会不可言传”,更别说只认代码的机器了。而通用大模型训练所依赖的互联网公开数据,在艺术领域又以英文网页为主,西方油画和卡通风格占了绝大多数——两重因素叠加,导致通用模型对国画的理解几乎空白,更难以体会中国画的笔墨逻辑。
举个例子,它也许可以把一只鸟画得很像,但不懂“留白”是什么意思,不知道“气韵生动”为何物。如果你让它画一幅“清供图”,它可能给你堆满整个画面,但毫无章法。
中国美术学院教授卢涛回忆,此前他用某个AI工具生成国画,出来的东西像卡通画,题跋和印章都没有。“它没学过,当然不知道有这些东西。”
这并不是技术不行,而是数据没喂对。
在卢涛看来,生成式AI最擅长的就是视觉内容生成,而中国美院大部分专业恰恰属于视觉艺术——两者天然相关。在探索“艺术+AI”的融合这件事上,美院没有理由不去做。
但问题在于,美院是一所纯艺术院校,没有计算机学科,也没有足够专业的AI技术团队,因此他们认识到,必须找一家既有技术能力、又能理解内容需求的科技公司来进行合作。
问题自然变成了:谁能帮美院把那些“只可意会”的艺术知识,变成机器可读、可训练的数据?
事实上,早在十四五规划期间,学校就提出了“美育星球”的概念,建立自己的非结构化数字资源平台,把各个教学单位的数字化资源汇集起来,做了初步的编目和标签。2024年,美院开始系统性地谋划“艺术+AI”。多模态AI爆发后,美院能快速切入,靠的就是这几年的积累。
严侃是中国美术学院信息技术中心副主任,他先后接触了好几家国内大厂。最后选中火山引擎,理由很简单:火山引擎在多模态大模型方面有着较为深厚的实力。
“特别是在视觉生成领域,已经有业内领先的模型。”
更重要的是反应速度。达成共识之后,火山引擎迅速拉了一个十几个人的专班小组,全面对接。“没有废话,我讲清楚我有什么、我要什么,他讲清楚他有什么、他的目标是什么。两边对完,后面推进就非常快了。”
2025年下半年,双方正式启动合作。项目锁定在一个非常具体的点上:中国画的花鸟方向。
02
火山引擎的方案:
从数据到智能体
中国美院有近30个专业。国画是最传统的门类之一,而花鸟方向又是国画里最难标准化的。
难在哪?国画的评判标准不是“像不像”,而是笔墨、气韵、神似。这些东西很难量化。
如果只看技术层面,火山引擎提供的是标准的AI能力:基模、算力、自动化标注工具、智能体封装。但真正让美院觉得不可替代的,是这套“高质量数据集+智能体”解决方案的全流程落地能力。
美院的第一步,不是直接扔画给AI,而是先做了一套18个维度的标签体系。这些标签包括皴法、设色、构图、款识、印章位置、题跋内容等等。
火山引擎的数据集建设服务,提供标准定义与规范化工具,帮助美院将这18个维度转化为机器可读的元数据结构。从抽象的“气韵”到具体的“笔触类型”,每一个艺术特征都被拆解为可标注的字段。
紧接着就是知识库训练与自动化打标,他们先不急着标画,美院给模型“开书单”,哪些经典画论、哪些权威教材、哪些代表作品是AI必须学习的。模型先读这些内容,建立对国画的基础认知,然后再对画作进行自动标注。
火山引擎的自动化打标工具支持参数化配置,美院专家可以在后台定义标注维度和规则。系统实时监控打标进程,自动生成图文对。整个过程不是黑盒——标注结果支持一键导出,专家可以随时人工校验和调整。
这样一来,美院团队在自动标注结果进行复核,发现不对的就改,发现维度缺失的就补。火山的技术专家还提醒美院:不能只给“好”的画,得把“一般”和“差”的也放进去,否则AI不知道好坏标准。
这个“好中差”样本策略,来自火山引擎在垂类模型训练中的经验。最终,美院提供了数万张代表性画作,覆盖各朝代、各主流流派。经过多轮迭代,自动化标注的一次性通过率达到95%,修改后的通过率超过99%。
在高质量数据集的基础上,火山引擎帮助美院进行模型的定向优化。通过模型后训练(Post-training)技术,将国画鉴赏、艺术创作理论等专业知识注入模型。针对不同业务需求,分别训练了用于艺术风格迁移、衍生品辅助设计、国画元素生成的专属垂直模型。
最后,他们将多个定制化模型组合,封装成开箱即用的智能体。用户只需要自然语言输入,即可获得专业的艺术解析或完成基础的艺术创作。智能体能力可灵活集成至小程序、交互大屏或Web端。
严侃提到,在交互设计上,火山引擎为他们提供了关键的产品经验。最初的设计是纯对话框,用户需要输入文字描述来生成图像。但内部封闭测试发现,不太懂艺术的人根本不知道该怎么描述需求。后来双方就把产品升级成“用图来选”的方式,分维度给提示词,甚至考虑到外国用户可能更不了解中国画,还做了中英文版本。
从交付成果来看,火山引擎没有把模型“黑盒化”。他们将几个定制化模型做了服务编排,搭出一条“理解—推理—生成”的工作链路,再封装成一个智能体。
这个智能体集成了两个核心能力:一是国画绘画大模型。你输入一段文字描述,或者上传一张参考图,它就能生成一幅符合国画意境的画作。其次是衍生品设计大模型,它能自动提取画作里的经典元素——比如一朵花、一只鸟、某处留白,然后重新组合,变成适合丝巾、帆布袋、明信片的设计草图。
这两个能力可以低门槛地接入小程序、交互大屏或者网页端,不管是展厅互动、课堂教学,还是文创产品开发,都能直接调用。
据卢涛回忆,良渚的那次会议上,聚集了近百名中外嘉宾。一位外国嘉宾来得晚了一些,时间充裕,他亲自上手,用AI画了一幅自己心目中的画。临走时,美院给他打印成一个杯垫。他很喜欢,又问要了两个。
03
最难的不是技术,是“神韵”
在整个合作中,火山引擎有两个特点让美院的团队印象深刻。
一是对内容的理解。火山引擎旗下的豆包大模型家族,已经在多模态生成领域积累了大量的用户反馈和工程经验。
其次是共创态度。严侃提到,相比“你把数据给我,我给你输出模型”的黑盒交付。艺术数据集本身就是美院的核心资产,火山引擎在这件事上的做法是:共同开发,数据归用户,技术能力开放。这种模式,在当下的AI合作中并不常见。
坦白说,乍一看,当下交付的智能体可能算不上什么“颠覆性产品”。
但恰恰是这种“不大”的试验,反而更值得思考。
你可以将它当作一次“最小可行性闭环”的验证。 美院和火山用不到半年的时间,把一个最传统的艺术门类,完整地走通了“数据→模型→应用”的全流程。证明了一件事:一个没有足够技术能力的专业机构,完全可以依靠自己的高质量数据,在通用大模型之上长出属于自己的AI能力。
卢涛反复提到一个观点:AI介入一个艺术品类之后,应该产生一种新的艺术形式,而不是去复刻旧的艺术形式。
他举了个例子,摄影术发明之后,如果人们只想着“怎么拍出油画效果”,那今天就不会有电影。电影是一种全新的艺术形式,它集成了美术、表演、文学、音乐,带来了新的生产力、新的经济模式,甚至带来了最早的空调——因为电影院太闷热了。
再比如书法和字体的关系。80年代电脑普及后,出现了字库。今天的上网、打字,用的99.9%是字体(宋体、楷体、黑体),而不是书法家手写的字。字体没有冲击书法,它们并行存在,而且字体本身已经形成了一个巨大的经济体。
“AI会不会侵害原来的艺术?我觉得不会。它会出一种新的东西,新的东西会带来新的生产关系、生产力、生产要素。”卢涛说。
从这个角度看,这次“中国画智能体”的真正价值,不在于它今天能画得多像齐白石,而在于它为“新中国画”的可能性投下了一块问路石。
在这个过程中,火山引擎这类技术厂商所扮演的角色值得重新审视。
相比“给一个现成的模型”,或者“做个外包项目”,它提供的是一个能力基座,围绕基模、算力、自动化标注工具、智能体封装经验,需求方自己的数据、自己的专家知识、自己的审美判断,始终掌握在自己手里。
这种“用户拥有数据、平台提供能力”的共创模式,可能是未来垂直行业落地AI的更主流路径。 尤其是对于那些把数据视为核心资产的机构。
从这个意义上说,中国美院和火山引擎的这次合作,与其说是一个“交付了两个智能体”的项目,不如说是一次“方法论”的共构。它回答了一个很多人关心的问题:一个非技术背景的专业机构,怎么用AI?
答案并不复杂:找准自己的数据壁垒,找一个愿意共创的技术伙伴,用一个最小的闭环跑通全流程,然后迭代、迭代、再迭代。
至于新的形态长什么样,现在还看不清楚。但至少,那个站在屏幕前用AI画画的泰国大使,那些感知到“距离我的研究领域最远,却给了我最大张力”的艺术家,已经感受到了点什么。
那可能就是一种新的可能性的开始。