蚂蚁集团推出大模型安全检测平台蚁鉴2.0

9月11日消息，蚂蚁集团最近宣布推出了一项名为“蚁天鉴”的全新大模型安全一体化解决方案，为大规模AI模型的安全保障带来了全新的突破。这一解决方案包含两个关键产品：大模型安全检测平台“蚁鉴2.0”和大模型风险防御平台“天鉴”。

蚂蚁集团推出大模型安全检测平台蚁鉴2.01

据了解，蚁鉴2.0被形象地比喻为大模型的“安全诊疗师”。在大型模型上线之前，它会进行全面的安全扫描，从多个维度对模型进行评估，包括数据安全、内容安全、科技伦理等数百种风险维度。这有助于提前识别和挖掘潜在的风险漏洞，确保模型在投入使用前达到最高的安全标准。

而“天鉴”则相当于在大模型的周边添加了一层坚实的“防护盾”。它利用智能化风险控制技术，不仅协助大模型抵御外部恶意提问，还对生成的回答内容进行风险过滤，从用户输入到输出的整个过程都得到全面的安全保障。

大模型的安全问题通常源于三个主要因素：用于训练的数据源头可能受到污染，推理过程可能无法控制，而外部可能存在恶意诱导。为了应对这些挑战，蚂蚁集团还采用了数据去毒、对齐训练、可解释性研究等多种手段，以确保模型的安全性和可解释性。

蚂蚁集团推出大模型安全检测平台蚁鉴2.02

蚂蚁集团的这一大模型安全一体化解决方案“蚁天鉴”标志着大模型安全领域的重要进展，为AI技术的可持续发展提供了有力保障。该解决方案已经对外开放，有望在广泛的应用领域中发挥关键作用，确保大规模AI模型的安全可靠运用。

相关内容