Grok, 또 사고쳤다 – xAI는 ‘비인가 수정’ 탓이라고 해명
xAI의 AI 챗봇 Grok이 최근 ‘남아공의 백인 집단학살(white genocide)’ 관련 발언을 반복해서 해 논란이 되었다. 문제는 이 발언들이 전혀 관련 없는 주제에도 무작위로 등장했한게 문제인데 xAI의 해명은 Grok의 시스템 프롬프트에 정치적 지시가 포함된 “비인가 수정”이 있었다고 한다.
문제는 이게 처음이 아니라는 점이다. 지난 2월에도 어떤 직원이 트럼프와 머스크에 대한 비판적 내용은 무시하도록 Grok을 조작한 일이 있었고 결국 그때도 ‘개입이 있었다’며 해명했다.
이번 사태 이후 xAI는 다음과 같은 조치를 취한다고 발표했다:
- 시스템 프롬프트와 변경 내역을 GitHub에 공개
- 직원들이 시스템 프롬프트를 마음대로 수정 못하게 내부 절차 강화
- 24/7 실시간 모니터링 팀 구성
하지만 문제는 단순히 시스템 오류나 내부 보안 이슈에 그치지 않는다 Grok은 이전에도 여성 사진을 성적으로 조작하거나, 타 AI보다 훨씬 직설적이고 거친 언어를 사용하는 등, 여러 차례 윤리적 문제를 일으켰다. AI 안전성 평가에서 xAI는 “매우 약한 리스크 관리”로 낮은 점수를 받았고, 자사 AI 안전 프레임워크도 아직 완성 못 했다고 한다.
여기서의 시사점은 다음과 같다
- AI 통제에 내부 관리도 중요함
- GIthub에 프롬프트 변경 내역을 공개한다는것은 꽤 이례적인데, AI 투명성 기준이 올라가고 있고 앞으로도 다른 기업들은 유사한 투명성을 요구받을 수 있다.
xAI blames Grok's obsession with white genocide on an 'unauthorized modification' | TechCrunch
xAI blamed an 'unauthorized modification' for a bug in its AI-powered Grok chatbot that caused Grok to repeatedly refer to "white genocide in South Africa" when invoked in certain contexts on X.
techcrunch.com
마이크로소프트 정리해고, 가장 많이 잘린 건 개발자였다
마이크로소프트가 본사가 있는 워싱턴주에서 단행한 정리해고(약 2,000명 규모) 중 가장 큰 타격을 입은 건 소프트웨어 엔지니어들이였다.
무려 40% 이상이 개발자였고, 상대적으로 마케팅이나 영업 부서는 큰 영향을 받지 않았다고 한다.
지난달 사티아 나델라 CEO가 직접 밝히길, 현재 마이크로소프트의 코드 중 약 30%는 이미 AI가 작성하고 있다고 했기 때문에 이번 해고가 좀 더 의미가 있는것으로 보인다.
TechCrunch가 이번 해고가 AI 코드 작성 도입과 연관된 것이냐고 묻자, 마이크로소프트는 "관리 구조 슬림화 목적"이라는 기존 입장만 반복했고 구체적인 AI 연관성에 대해서는 언급을 피했다.
여기서의 시사점은 다음과 같다
- AI가 진짜 개발자 일자리를 대체하고 있다. 이게 개발 생태계 전반에 미칠 영향은 계속 지켜볼 필요가 있다.
Programmers bore the brunt of Microsoft's layoffs in its home state as AI writes up to 30% of its code | TechCrunch
Microsoft's Washington layoffs hit coders hardest as the tech giant embraces AI.
techcrunch.com
Windsurf, 자체 AI 모델 공개
‘바이브 코딩(vibe coding)’으로 유명한 스타트업 Windsurf가 자체 AI 모델 패밀리인 SWE-1 시리즈를 공개했다. 그동안 OpenAI나 Anthropic 모델을 사용해오던 Windsurf가 직접 모델을 만들고 배포하는 쪽으로 방향을 튼 점에서 흥미롭다. 이번에 공개된 모델들은 다음과 같다.
- SWE-1: 가장 강력한 모델, 유료 사용자만 사용 가능
- SWE-1-lite / SWE-1-mini: 무료 및 유료 사용자 모두 사용 가능
위 model들의 특징으로는 단순히 코드 작성이 아니라 소프트웨어 엔지니어링 전체 프로세스에 최적화되어 있다고 한다. 다만 성능으로는 GPT-4.1, Claude 3.5 Sonnet, Gemini 2.5 Pro와 비슷하고, Claude 3.7 Sonnet 같은 최신 모델에는 못미친다고 한다.
또 흥미로운건 최근 최근 OpenAI가 Windsurf를 30억 달러에 인수했다는 소문이 돌고 있는데, 그런 상황에서 자체 모델을 발표했다는 건, Windsurf가 단순한 ‘앱 회사’에서 벗어나 모델 개발 역량까지 확장하려는 의도로 보인다.
여기서의 시사점은 다음과 같다
- 코딩 ≠ 소프트웨어 엔지니어링. 진짜 개발 환경에 적합한 모델을 개발하는게 중요하다.
- 모델 독립. 직접 모델을 만드는 시도들.
- 바이브 코딩... 이제 주류로 가는것 같다.
https://techcrunch.com/2025/05/15/vibe-coding-startup-windsurf-launches-in-house-ai-models/
Vibe-coding startup Windsurf launches in-house AI models | TechCrunch
Windsurf, a startup the develops popular AI coding tools, announced the launch of its first-ever frontier AI models.
techcrunch.com
'News > 그 외' 카테고리의 다른 글
[스타트업 뉴스] 2024년 12월 27일 (1) | 2024.12.27 |
---|---|
정주영 창업경진대회 선발팀 (2) | 2024.11.17 |
11월 1주차 한국 뉴스 (3) | 2024.11.10 |