蚂蚁集团推出大模型安全检测平台蚁鉴2.0

2023-09-23 16:01:10 网络

9月11日消息,蚂蚁集团最近宣布推出了一项名为“蚁天鉴”的全新大模型安全一体化解决方案,为大规模AI模型的安全保障带来了全新的突破。这一解决方案包含两个关键产品:大模型安全检测平台“蚁鉴2.0”和大模型风险防御平台“天鉴”。

蚂蚁集团推出大模型安全检测平台蚁鉴2.01

据了解,蚁鉴2.0被形象地比喻为大模型的“安全诊疗师”。在大型模型上线之前,它会进行全面的安全扫描,从多个维度对模型进行评估,包括数据安全、内容安全、科技伦理等数百种风险维度。这有助于提前识别和挖掘潜在的风险漏洞,确保模型在投入使用前达到最高的安全标准。

而“天鉴”则相当于在大模型的周边添加了一层坚实的“防护盾”。它利用智能化风险控制技术,不仅协助大模型抵御外部恶意提问,还对生成的回答内容进行风险过滤,从用户输入到输出的整个过程都得到全面的安全保障。

大模型的安全问题通常源于三个主要因素:用于训练的数据源头可能受到污染,推理过程可能无法控制,而外部可能存在恶意诱导。为了应对这些挑战,蚂蚁集团还采用了数据去毒、对齐训练、可解释性研究等多种手段,以确保模型的安全性和可解释性。

蚂蚁集团推出大模型安全检测平台蚁鉴2.02

蚂蚁集团的这一大模型安全一体化解决方案“蚁天鉴”标志着大模型安全领域的重要进展,为AI技术的可持续发展提供了有力保障。该解决方案已经对外开放,有望在广泛的应用领域中发挥关键作用,确保大规模AI模型的安全可靠运用。

相关内容

更多

精品推荐

更多