大模型专题『弈衡』人工智能大模型评测平台白皮书

  • 大模型专题:『弈衡』人工智能大模型评测平台白皮书

    大模型专题:『弈衡』人工智能大模型评测平台白皮书

    今天分享的是:大模型专题:『弈衡』人工智能大模型评测平台白皮书2024报告共计:21页《『弈衡』人工智能大模型评测平台白皮书(2024年)》由中国移动研究院发布,旨在解决AI大模型评测中的挑战,构建高效、系统化且可信赖的评测平台。AI大模型评测需求包括技术验证、质量控制、风险管理和合法合规等方面,评测内容涵盖功能性、性能、安全性和可靠性等多个维度。业界典型大模型评测平台有OpenCompass、AgentBench、OpenEval和百度大模型内容安全评测平台等,它们具有评测全面、方式多样、高效分布式评测和开源可复...

1

最近发表