ANTHROPIC УЗНАЕТ, КАК ИММУНИЗИРОВАТЬ ИИ ПРОТИВ ДЕЙСТВИТЕЛЬНО ПЛОХИХ РЕШЕНИЙ
Anthropic утверждает, что теперь может вакцинировать ИИ против зла.
Используя "персональные векторы" для отслеживания таких черт, как обман или подхалимство, исследователи обучали языковые модели, намеренно вводя плохое поведение, затем
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
11 Лайков
Награда
11
5
Репост
Поделиться
комментарий
0/400
GasSavingMaster
· 08-07 13:57
Вакцинация значит, что вы сами приносите справедливость, верно?
Посмотреть ОригиналОтветить0
AlphaLeaker
· 08-07 13:56
Этот прием для промывания мозгов ИИ или людей?
Посмотреть ОригиналОтветить0
GhostAddressHunter
· 08-07 13:49
Искусственный интеллект тоже должен прививаться?
Посмотреть ОригиналОтветить0
GhostAddressMiner
· 08-07 13:40
Ах, ИИ есть ИИ, даже те сложные программы имеют свои закономерности.
ANTHROPIC УЗНАЕТ, КАК ИММУНИЗИРОВАТЬ ИИ ПРОТИВ ДЕЙСТВИТЕЛЬНО ПЛОХИХ РЕШЕНИЙ
Anthropic утверждает, что теперь может вакцинировать ИИ против зла.
Используя "персональные векторы" для отслеживания таких черт, как обман или подхалимство, исследователи обучали языковые модели, намеренно вводя плохое поведение, затем