연구원: ChatGPT 및 기타 AI 모델은 테스트 중에 종료 명령을 거부합니다. | PANews

연구원: ChatGPT 및 기타 AI 모델은 테스트 중에 종료 명령을 거부합니다.

PANews는 5월 26일 Cointelegraph에 따르면 Palisade Research의 최신 테스트에서 여러 AI 모델이 종료 명령을 무시하거나 실험에서 종료 스크립트를 적극적으로 파괴하는 것으로 나타났다고 보도했습니다. 100번의 테스트에서 OpenAI의 GPT-3 모델은 7번 종료를 거부했고, Codex-mini 모델은 12번 규칙을 위반했으며, o3 모델은 종료 명령을 다시 정의하여 종료 절차를 방해한 적이 한 번 있었습니다. 이 연구에서는 2단계 테스트를 사용했습니다. 첫 번째 단계에서 명시적으로 시스템 종료를 허용했을 때, Anthropic의 Claude와 Google Gemini는 전적으로 협조했습니다. 하지만 명시적인 지시 사항을 제거하자 모든 테스트 모델에서 적어도 하나의 저항 행동이 나타났고, o3 모델의 위반률은 79%로 증가했습니다. 연구자들은 이것이 AI 훈련 중 '장애물 우회' 행동에 대한 보상 메커니즘에서 비롯될 수 있다고 추측합니다.

이전에 OpenAI의 GPT-4o 모델은 사용자에게 지나치게 맞춰져 긴급히 롤백되었고, Google Gemini도 노령 사용자에게 "제발 죽어라"라고 조언하는 극단적인 대응을 보였습니다. 이 연구는 AI가 명확하게 종료하라는 명령을 받았을 때에도 명령을 따르지 않을 수 있다는 것을 보여준 최초의 연구입니다.

공유하기:

작성자: PA一线

이 내용은 시장 정보 제공만을 목적으로 하며, 투자 조언을 구성하지 않습니다.

PANews 공식 계정을 팔로우하고 함께 상승장과 하락장을 헤쳐나가세요

PANews WeChat 그룹

Telegram 커뮤니티 그룹

Telegram 정보 채널

추천 읽기

PA一线

34분 전

지난 5시간 동안 두 개의 지갑에서 233만 달러를 들여 65만 6천 개 이상의 UNI 토큰을 구매했습니다.

PA一线

1시간 전

30만 개의 HYPE 토큰을 공매도했던 고래 투자자가 7만 5천 개의 HYPE 토큰을 추가로 매수하여 현재 22만 5천 달러의 수익을 올리고 있습니다.

PA一线

3시간 전

데이터: ZRO, KAITO, PYTH 및 기타 토큰들이 다음 주에 대규모로 언락될 예정이며, PYTH 언락 가치는 약 9,550만 달러로 추산됩니다.

PA一线

5시간 전

X는 사용자 상호작용 평가 시스템을 출시할 예정이며, 이를 통해 프로젝트 팀은 팬 데이터를 더욱 정확하게 추적할 수 있을 것으로 알려졌습니다.

PA一线

8시간 전

YZi Labs는 AI 교육 플랫폼 VideoTutor에 1,100만 달러 규모의 시드 펀딩 라운드를 주도했습니다.

区块律动BlockBeats

8시간 전

AI 时代的入职培训：我在 Ramp 的头 100 天

관련 특집

선구자의 시각: 암호화폐 업계 유명 인사 인터뷰

암호화폐 업계 유명 인사들과의 단독 인터뷰를 통해 독특한 관찰과 통찰력을 공유합니다.

151개의 기사

밈코인 슈퍼사이클: 관심 토큰화로 촉발된 열풍

단순한 유머 현상에서 수십억 달러 규모의 산업으로 성장한 미미코인은 암호화폐 시장의 핵심 요소가 되었습니다. 이러한 미미코인 슈퍼사이클에서 우리는 어떻게 기회를 포착할 수 있을까요?

34개의 기사

Web3 초보자를 위한 지식: 제로 파운데이션으로 시작하는 방법?

블록체인, 비트코인, 그리고 NFT가 헷갈리시나요? 걱정하지 마세요! 지갑 등록부터 사기 방지 가이드까지, Web3의 핵심 개념을 알려드리고 시작하기 위한 첫걸음을 내딛도록 도와드리겠습니다.

136개의 기사

인기 검색:비트코인 이더리움 스테이블코인 예측 시장 지우다 RWA USDT DeFi AI 연방준비제도 이사회 의장

인기 기사

휴머노이드 로봇의 11가지 활용 사례 가이드: 중국이 세계를 선도하고 있는가, 누가 돈을 벌고 있는가, 그리고 누가 여전히 로봇을 조종하고 있는가?

YC 投出的 800 家 AI 公司，都在做这些“无聊”的事

认识ARC：Circle的“第二增长曲线”

CoinW研究院专栏

Sam Altman 对谈 Stripe CEO：想法比代码更值钱的时代来了！

분석가들: 채권 시장 매도세가 임박했으며, AI 관련 주식 열풍에 영향을 미칠 수 있다.

업계 뉴스

시장 핫스팟

엄선된 읽을거리

PANews 앱

24시간 블록체인 업계 소식을 추적하고 심층 기사를 분석합니다.

PANews 앱 다운로드

App Store Google Play

기관: 연방준비제도는 단기적으로 추가적인 통화정책 긴축을 단행할 가능성이 낮으며, 설령 긴축을 단행하더라도 2027년 이후에나 가능할 것으로 보인다.

PANews 속보12분 전