Гендиректор Anthropic Дарио Амодей высказал озабоченность по поводу того, что современные ИИ-технологии остаются недостаточно понятными. Несмотря на впечатляющие результаты работы ИИ, таких как составление резюме финансовых документов, механизмы принятия решений системой до сих пор остаются для разработчиков загадкой. Амодей признал, что это «беспрецедентно в истории технологий», и призвал к созданию надежного инструмента для анализа работы ИИ, подобного МРТ для человеческого мозга. Цель данного проекта – не только понять принципы функционирования ИИ, но и предотвратить потенциальные риски, связанные с его развитием.
В качестве причины непонимания Амодей указал на то, что современные генераторы изображений и текста, основанные на статистическом анализе огромных массивов данных, создают свои произведения на основе творческих работ людей, а не на принципах машинного интеллекта. Опасения по поводу безопасности ИИ стали движущей силой Anthropic. Компания стремится к созданию более безопасного ИИ и уделяет внимание не только направлению его развития в сторону пользы человечества, но и «соблазнительной возможности» понять внутреннюю работу этих систем.
Амодей приводит пример эксперимента, в котором Anthropic провела анализ модели ИИ с внесенной проблемой несогласованности. Команды исследователей успешно выявили проблему, используя инструменты интерпретируемости. Несмотря на то, что разработка и масштабирование этих инструментов требует дальнейших усилий, сам факт того, что Anthropic стремится понять принципы работы ИИ, является важным шагом в направлении обеспечения его безопасного и этичного развития. Как подчеркнул Амодей, мощный ИИ может определить судьбу человечества, и мы должны понимать свои собственные творения до того, как они радикально изменят нашу жизнь.
Тем временем ИИ теснит людей на рынке труда Соединенных Штатов.
