FT商学院

AI企业正在加紧重新设计模型测试并创建新的基准

快速发展的技术正在超越当前评估和比较大型语言模型的方法。
OpenAI、微软(Microsoft)、Meta和Anthropic都计划构建能够代表人类自主执行任务的AI代理人

科技集团正急于重新设计测试和评估人工智能模型的方式,因为快速发展的技术已经超越了当前的基准。

OpenAI、微软、Meta和Anthropic最近都宣布了计划,构建能够代表人类自主执行任务的AI代理人。为了有效地实现这一目标,这些系统必须能够使用推理和规划来执行越来越复杂的操作。

您已阅读10%(197字),剩余90%(1815字)包含更多重要信息,订阅以继续探索完整内容,并享受更多专属服务。
版权声明:本文版权归manbetx20客户端下载 所有,未经允许任何单位或个人不得转载,复制或以任何其他方式使用本文全部或部分,侵权必究。