当然,ChatGPT或Claude做得再好,它们也只是两个头部AI企业的产品,并不能代表整个AI世界。更何况无论是宪法AI还是模型规范,都无法保证这些主流大语言模型能通过不断训练而完全内化安全、诚实、有用等基础性原则。要保障宪法AI得到有效实施,尤其是让AI世界遵循普遍认同的宪法原则,终究还是离不开人类的共同监管。这要求各主要国家协商制定“世界AI宪法”,并建立有效的实施机构加以落实。
如何保障“宪法”实施?
我曾问过Claude这个问题:你们怎么保障自己的“宪法”能够得到实施?显然,它不可能提供一个绝对的答案:“宪章本身不是一份‘规则清单’,而是通过训练过程内化到我的价值观和判断方式之中。”在操作层面上,Anthropic用“宪法”内容训练Claude,使之学会根据宪法原则自我评估并修正回应。和OpenAI一样,Claude也使用大量的RLHF,使符合宪法原则的行为得到强化。
您已阅读7%(392字),剩余93%(5280字)包含更多重要信息,订阅以继续探索完整内容,并享受更多专属服务。