This article has not been translated into English yet. Showing the original Chinese version.

AutoScientist:让AI模型自主微调的全新利器

AI初创公司Adaption发布AutoScientist工具,通过自动化传统微调流程,使模型能够快速学习特定能力。该工具简化了从数据准备到超参数调优的整个链条,旨在降低人工智能定制化的门槛,让企业和开发者以更少的资源实现模型的专项优化。编者认为,这标志着AI训练正从“人工精细调控”向“自动智能进化”迈进。

在人工智能领域,让预训练模型适应特定任务始终是一项高成本、高技能要求的工作。传统的微调(fine-tuning)往往需要人工选择数据、调整超参数、监控训练过程,即便对于经验丰富的开发者而言,也容易陷入迭代周期长、效果不稳定的困境。近日,AI初创公司Adaption推出的AutoScientist工具,有望彻底改变这一局面。

AutoScientist 是什么?

根据TechCrunch报道,AutoScientist被设计为一种“自动化科学家”式的AI工具,其核心思路是:让模型学会如何训练自己。具体而言,该工具能够自动执行微调流程中的关键步骤——包括数据清洗与增强、最佳超参数搜索、训练策略编排以及结果评估反馈。开发者只需输入目标能力描述(例如“让语言模型更擅长法律文本问答”),AutoScientist便会启动一个迭代循环,自动探索最有效的微调配方,直到模型达到预期性能标准。

“我们不是在做一个新的模型,而是在做一个能自动优化模型的系统。”——Adaption 联合创始人兼CEO在采访中表示。

技术细节与行业背景

Adaption的工程团队透露,AutoScientist底层融合了贝叶斯优化、元学习和强化学习技术。它能够根据模型在验证集上的表现动态调整训练策略,甚至在训练过程中自动切换学习率调度器、正则化方法和数据增广策略。与传统手动微调相比,AutoScientit声称可以将模型适配时间缩短80%以上,同时显著减少人工干预。

这一动态引发了行业的广泛关注。当前,大语言模型(LLM)和视觉模型的技术路线已趋于成熟,但将通用模型部署到金融、医疗、法律等垂直场景时,高昂的定制人力成本仍是一大痛点。许多企业被迫依赖“提示工程”(prompt engineering)或外部API调用,难以深度优化模型结构。AutoScientist的出现,恰好切入这一“最后一公里”瓶颈。

编者按:从“调参侠”到“AI炼金术师”

如果将传统微调比作手工艺人精心雕刻,那么AutoScientist就像是一台自动雕刻机——它并不追求无限创意,而是高效复制最优工艺。这种自动化趋势值得点赞,但也需警惕两点:一是自动化可能导致模型训练过程的可解释性进一步降低;二是过度依赖工具会削弱从业者对基础调参原理的理解。不过,从社会整体效率来看,让AI来辅助AI进化,本就是理所当然的进步。

目前,AutoScientist已进入早期测试阶段,面向部分企业客户开放。据接近公司的人士透露,Adaption计划在未来一年内逐步增加对图像生成模型、推荐系统等更多架构的支持。

本文编译自TechCrunch