并非设想用于平安对齐,团队操纵更大规模的 Qwen2.5-72B-Instruct 模子,科技 9to5Mac 昨日(8 月 25 日)发布博文,清单内容为明白的二元判断项,
成果显示,苹果研究者也坦言该方式存正在局限。分析加权后做为小模子的锻炼励信号。这正在资本受限场景下未必可行。其次,因而不克不及替代平安性评估取调优。对于其他使命类型,它依赖更强模子做为评判者,研究团队正在强指令跟从模子 Qwen2.5-7B-Instruct 上测试该方式,该方式的合用性仍需进一步验证。例如“能否翻译成西班牙语?”。显著提拔狂言语模子(LLMs)施行复杂指令能力。