AI企业正在加紧重新设计模型测试并创建新的基准

快速发展的技术正在超越当前评估和比较大型语言模型的方法。