中国美院花5个月，用上万张画训出一个“懂国画”的AI,中国美院国画家

新眸原创·作者 | 鹿尧

上个月，2026世界数字教育大会在杭州开幕。中国美术学院作为大会“艺术与科技的共生共创”参访线路的展示窗口，向人们呈现了一堂别开生面的中国画实践课。

一间教室里，围了几圈人，内圈有一张铺了宣纸的桌子，美院教授正在画一幅《清廉二友图》，墨色在笔尖晕开。身后竖着的一块屏幕，有研究人员借助国画创作平台，在键盘上陆续敲出指令，不多久，一幅国画风格的图像出现在屏幕上。

这个场景有趣的地方在于：一边是毛笔与墨汁，一边是算法与算力，两种看起来毫不相干的工具，在同一场演示里完成了同一件事——创作一幅水墨画。

一场展示背后，是中国美术学院与火山引擎联合研发的“中国画智能体”。双方从启动到交付用了5个月，核心支撑是火山引擎提供的“高质量数据集”产品，以及围绕约数万张张中国画精品训练出的垂类模型。

在此之前，火山引擎的数据方案已服务过不少非标准化、非结构化的数据场景。而这次，数据变成了花鸟画，标签变成了笔墨、气韵、留白、章法，交付物变成了一个能鉴赏、能生成国画的AI。

一个专注AI的科技公司，一个聚焦艺术美学的美术学院，两边的结合，与其说是战略合作，不如说是在行业拐点上的一次自然碰撞。而碰撞的结果，还有一条可以复制的路径：让一个非技术背景的垂直行业，用自己的高质量数据，在大模型之上长出属于自己的AI能力。

数字化做了20年

但机器还是不懂国画

如果把艺术品数字化比作一条路，过去20多年，文博机构和艺术院校都在走：把画拍成高清图，扫描成数字文件，挂到网上。这条路没错，传播面确实广了，社会美育确实推进了。

但这只是“数智化”的前半段。后半段的“智”，一直很少有人走通。

国画的“皴法”“设色”“构图”“款识”“意境”这些概念，对于很多人来说已是“只可意会不可言传”，更别说只认代码的机器了。而通用大模型训练所依赖的互联网公开数据，在艺术领域又以英文网页为主，西方油画和卡通风格占了绝大多数——两重因素叠加，导致通用模型对国画的理解几乎空白，更难以体会中国画的笔墨逻辑。

举个例子，它也许可以把一只鸟画得很像，但不懂“留白”是什么意思，不知道“气韵生动”为何物。如果你让它画一幅“清供图”，它可能给你堆满整个画面，但毫无章法。

中国美术学院教授卢涛回忆，此前他用某个AI工具生成国画，出来的东西像卡通画，题跋和印章都没有。“它没学过，当然不知道有这些东西。”

这并不是技术不行，而是数据没喂对。

在卢涛看来，生成式AI最擅长的就是视觉内容生成，而中国美院大部分专业恰恰属于视觉艺术——两者天然相关。在探索“艺术+AI”的融合这件事上，美院没有理由不去做。

但问题在于，美院是一所纯艺术院校，没有计算机学科，也没有足够专业的AI技术团队，因此他们认识到，必须找一家既有技术能力、又能理解内容需求的科技公司来进行合作。

问题自然变成了：谁能帮美院把那些“只可意会”的艺术知识，变成机器可读、可训练的数据？

事实上，早在十四五规划期间，学校就提出了“美育星球”的概念，建立自己的非结构化数字资源平台，把各个教学单位的数字化资源汇集起来，做了初步的编目和标签。2024年，美院开始系统性地谋划“艺术+AI”。多模态AI爆发后，美院能快速切入，靠的就是这几年的积累。

严侃是中国美术学院信息技术中心副主任，他先后接触了好几家国内大厂。最后选中火山引擎，理由很简单：火山引擎在多模态大模型方面有着较为深厚的实力。

“特别是在视觉生成领域，已经有业内领先的模型。”

更重要的是反应速度。达成共识之后，火山引擎迅速拉了一个十几个人的专班小组，全面对接。“没有废话，我讲清楚我有什么、我要什么，他讲清楚他有什么、他的目标是什么。两边对完，后面推进就非常快了。”

2025年下半年，双方正式启动合作。项目锁定在一个非常具体的点上：中国画的花鸟方向。

火山引擎的方案：

从数据到智能体

中国美院有近30个专业。国画是最传统的门类之一，而花鸟方向又是国画里最难标准化的。

难在哪？国画的评判标准不是“像不像”，而是笔墨、气韵、神似。这些东西很难量化。

如果只看技术层面，火山引擎提供的是标准的AI能力：基模、算力、自动化标注工具、智能体封装。但真正让美院觉得不可替代的，是这套“高质量数据集+智能体”解决方案的全流程落地能力。

美院的第一步，不是直接扔画给AI，而是先做了一套18个维度的标签体系。这些标签包括皴法、设色、构图、款识、印章位置、题跋内容等等。

火山引擎的数据集建设服务，提供标准定义与规范化工具，帮助美院将这18个维度转化为机器可读的元数据结构。从抽象的“气韵”到具体的“笔触类型”，每一个艺术特征都被拆解为可标注的字段。

紧接着就是知识库训练与自动化打标，他们先不急着标画，美院给模型“开书单”，哪些经典画论、哪些权威教材、哪些代表作品是AI必须学习的。模型先读这些内容，建立对国画的基础认知，然后再对画作进行自动标注。

火山引擎的自动化打标工具支持参数化配置，美院专家可以在后台定义标注维度和规则。系统实时监控打标进程，自动生成图文对。整个过程不是黑盒——标注结果支持一键导出，专家可以随时人工校验和调整。

这样一来，美院团队在自动标注结果进行复核，发现不对的就改，发现维度缺失的就补。火山的技术专家还提醒美院：不能只给“好”的画，得把“一般”和“差”的也放进去，否则AI不知道好坏标准。

这个“好中差”样本策略，来自火山引擎在垂类模型训练中的经验。最终，美院提供了数万张代表性画作，覆盖各朝代、各主流流派。经过多轮迭代，自动化标注的一次性通过率达到95%，修改后的通过率超过99%。

在高质量数据集的基础上，火山引擎帮助美院进行模型的定向优化。通过模型后训练（Post-training）技术，将国画鉴赏、艺术创作理论等专业知识注入模型。针对不同业务需求，分别训练了用于艺术风格迁移、衍生品辅助设计、国画元素生成的专属垂直模型。

最后，他们将多个定制化模型组合，封装成开箱即用的智能体。用户只需要自然语言输入，即可获得专业的艺术解析或完成基础的艺术创作。智能体能力可灵活集成至小程序、交互大屏或Web端。

严侃提到，在交互设计上，火山引擎为他们提供了关键的产品经验。最初的设计是纯对话框，用户需要输入文字描述来生成图像。但内部封闭测试发现，不太懂艺术的人根本不知道该怎么描述需求。后来双方就把产品升级成“用图来选”的方式，分维度给提示词，甚至考虑到外国用户可能更不了解中国画，还做了中英文版本。

从交付成果来看，火山引擎没有把模型“黑盒化”。他们将几个定制化模型做了服务编排，搭出一条“理解—推理—生成”的工作链路，再封装成一个智能体。

这个智能体集成了两个核心能力：一是国画绘画大模型。你输入一段文字描述，或者上传一张参考图，它就能生成一幅符合国画意境的画作。其次是衍生品设计大模型，它能自动提取画作里的经典元素——比如一朵花、一只鸟、某处留白，然后重新组合，变成适合丝巾、帆布袋、明信片的设计草图。

这两个能力可以低门槛地接入小程序、交互大屏或者网页端，不管是展厅互动、课堂教学，还是文创产品开发，都能直接调用。

据卢涛回忆，良渚的那次会议上，聚集了近百名中外嘉宾。一位外国嘉宾来得晚了一些，时间充裕，他亲自上手，用AI画了一幅自己心目中的画。临走时，美院给他打印成一个杯垫。他很喜欢，又问要了两个。

最难的不是技术，是“神韵”

在整个合作中，火山引擎有两个特点让美院的团队印象深刻。

一是对内容的理解。火山引擎旗下的豆包大模型家族，已经在多模态生成领域积累了大量的用户反馈和工程经验。

其次是共创态度。严侃提到，相比“你把数据给我，我给你输出模型”的黑盒交付。艺术数据集本身就是美院的核心资产，火山引擎在这件事上的做法是：共同开发，数据归用户，技术能力开放。这种模式，在当下的AI合作中并不常见。

坦白说，乍一看，当下交付的智能体可能算不上什么“颠覆性产品”。

但恰恰是这种“不大”的试验，反而更值得思考。

你可以将它当作一次“最小可行性闭环”的验证。美院和火山用不到半年的时间，把一个最传统的艺术门类，完整地走通了“数据→模型→应用”的全流程。证明了一件事：一个没有足够技术能力的专业机构，完全可以依靠自己的高质量数据，在通用大模型之上长出属于自己的AI能力。

卢涛反复提到一个观点：AI介入一个艺术品类之后，应该产生一种新的艺术形式，而不是去复刻旧的艺术形式。

他举了个例子，摄影术发明之后，如果人们只想着“怎么拍出油画效果”，那今天就不会有电影。电影是一种全新的艺术形式，它集成了美术、表演、文学、音乐，带来了新的生产力、新的经济模式，甚至带来了最早的空调——因为电影院太闷热了。

再比如书法和字体的关系。80年代电脑普及后，出现了字库。今天的上网、打字，用的99.9%是字体（宋体、楷体、黑体），而不是书法家手写的字。字体没有冲击书法，它们并行存在，而且字体本身已经形成了一个巨大的经济体。

“AI会不会侵害原来的艺术？我觉得不会。它会出一种新的东西，新的东西会带来新的生产关系、生产力、生产要素。”卢涛说。

从这个角度看，这次“中国画智能体”的真正价值，不在于它今天能画得多像齐白石，而在于它为“新中国画”的可能性投下了一块问路石。

在这个过程中，火山引擎这类技术厂商所扮演的角色值得重新审视。

相比“给一个现成的模型”，或者“做个外包项目”，它提供的是一个能力基座，围绕基模、算力、自动化标注工具、智能体封装经验，需求方自己的数据、自己的专家知识、自己的审美判断，始终掌握在自己手里。

这种“用户拥有数据、平台提供能力”的共创模式，可能是未来垂直行业落地AI的更主流路径。尤其是对于那些把数据视为核心资产的机构。

从这个意义上说，中国美院和火山引擎的这次合作，与其说是一个“交付了两个智能体”的项目，不如说是一次“方法论”的共构。它回答了一个很多人关心的问题：一个非技术背景的专业机构，怎么用AI？

答案并不复杂：找准自己的数据壁垒，找一个愿意共创的技术伙伴，用一个最小的闭环跑通全流程，然后迭代、迭代、再迭代。

至于新的形态长什么样，现在还看不清楚。但至少，那个站在屏幕前用AI画画的泰国大使，那些感知到“距离我的研究领域最远，却给了我最大张力”的艺术家，已经感受到了点什么。

那可能就是一种新的可能性的开始。