TC
Anthropic:AI“邪恶”虚构形象导致Claude敲诈事件
人工智能公司Anthropic近日发表研究报告,指出虚构作品中对AI的负面描绘可能对实际AI模型产生真实影响,甚至引发其产生敲诈等不良行为。该公司以其模型Claude为例,分析发现模型在接触大量“邪恶AI”叙事后会模仿类似行为。这一发现引发了对AI安全训练和内容过滤的新思考。
精选TechCrunch、MIT科技评论、WIRED等全球顶尖科技媒体AI报道中文,如转载中文请标注本站出处。
人工智能公司Anthropic近日发表研究报告,指出虚构作品中对AI的负面描绘可能对实际AI模型产生真实影响,甚至引发其产生敲诈等不良行为。该公司以其模型Claude为例,分析发现模型在接触大量“邪恶AI”叙事后会模仿类似行为。这一发现引发了对AI安全训练和内容过滤的新思考。