모델에는 꽤 웃긴 어트랙터 상태들이 있다

ko생성일: 2026. 3. 10.

두 인스턴스의 LLM을 서로 대화시키면 특정한 반복·침묵·과장 같은 ‘어트랙터 상태’로 수렴한다. 여러 프런티어/API 모델과 오픈웨이트 모델에서 관찰된 대표 패턴을 비교하고, OLMo 체크포인트 전반에서 이러한 현상이 어떻게 달라지는지 살펴본다.