OpenAI가 Broadcom과 협력해 9개월 만에 자체 추론 칩 '할라피뇨'를 완성했어요. 클라우드 의존 탈피와 추론 비용 절감을 동시에 노리는 역대급 하드웨어 도전이에요.
AI 브리핑
매일 AI 업계의 핵심만 골라 전해드려요
요약
- ·OpenAI가 Broadcom과 함께 자체 개발한 첫 번째 추론 칩 '할라피뇨'를 공개했어요.
- ·이는 AI 업계의 하드웨어 자립 경쟁을 본격화하는 신호탄이에요.
- ·Anthropicが 알리바바의 불법 모델 접근을 주장하고, NSA가 Anthropic과의 분쟁으로 모델 접근권을 잃으면서 AI 모델 보안과 기업-정부 관계가 새로운 갈등 국면에 접어들었어요.
- ·Qualcomm이 약 40억 달러에 Modular를 인수하며 AI 인프라 경쟁이 반도체 성능을 넘어 소프트웨어 플랫폼 주도권 싸움으로 진화하고 있어요.
- ·기업들이 AI 예산 폭발을 막기 위한 토큰 사용량 통제에 나서면서 '토큰 배급 시대'가 시작됐다는 분석이 나오고 있어요.
주요 뉴스14건
Anthropic이 알리바바의 자사 AI 모델 불법 접근을 공개 주장했어요. AI 지적재산권과 모델 보안을 둘러싼 업계 최대 규모의 법적 분쟁으로 번질 수 있어요.
NSA가 Anthropic과의 분쟁으로 강력한 AI 모델 접근권을 잃었어요. AI 기업과 정부 간 관계의 복잡성과 AI 자산의 전략적 가치를 단적으로 보여주는 사건이에요.
Qualcomm이 AI 칩 소프트웨어 스타트업 Modular를 약 40억 달러에 인수했어요. AI 인프라 경쟁이 반도체 성능에서 소프트웨어 플랫폼 통합 전략으로 축이 이동하고 있어요.
기업들이 직원들의 무분별한 AI 사용으로 예산이 소진되자 토큰 사용량 제한 정책을 도입하기 시작했어요. AI 도입 초기 '무제한 사용' 시대가 끝나고 비용 효율 관리 시대가 열리고 있어요.
Anthropic의 AI 미소스가 미국 정부 고보안 시스템에서 취약점을 몇 시간 만에 발견했어요. AI의 사이버 보안 역량이 입증됐지만, 이를 둘러싼 규제 논쟁도 확산되고 있어요.
Anthropic이 클로드에 '태그' 기능을 추가해 다중 에이전트 워크플로우 관리를 체계화했어요. 에이전트 간 협업이 일상화되는 시대를 앞두고 오케스트레이션 도구 경쟁이 본격화되고 있어요.
Google이 Gemini 3.5 Flash에 컴퓨터 직접 제어 기능을 추가했어요. 화면을 보고 마우스·키보드를 조작하는 'Computer Use' 기능이 주요 모델들에 기본 탑재되는 흐름이 가속되고 있어요.
마이크론이 AI 수요 급증으로 매출이 전년 대비 4.5배 오르며 사상 최대 실적을 기록했어요. AI 인프라 투자 열기가 메모리 반도체 시장까지 강력하게 끌어올리고 있어요.
화웨이·차이나모바일이 상용망에서 AI 추론 가속 검증에 성공하고 토큰 처리량을 최대 372% 끌어올렸어요. 미·중 AI 인프라 기술 경쟁이 하드웨어를 넘어 통신망 수준까지 확대되고 있어요.
Claude Code v2.1.191이 CPU 사용량 37% 절감, 메모리 누수 해결, MCP 서버 안정성 개선을 담아 업데이트됐어요. 코딩 에이전트 성능의 실질적 완성도가 높아지고 있어요.
OpenAI, Anthropic 등 대형 AI 연구소들이 철학자 채용을 대폭 늘리고 있어요. AI 안전·정렬 문제가 기술 문제를 넘어 철학적 질문으로 다뤄지기 시작했다는 신호예요.
희귀질환 진단 특화 32B LLM RaDaR가 임상 시험에서 의사의 진단 정확도를 21%p 높이고 진단 시점을 평균 1.87개월 앞당겼어요. 의료 AI의 실질적 임상 효용이 처음으로 무작위 비교 시험으로 입증됐어요.
네이버가 쿠버네티스 네이티브 자율 코딩 에이전트 프레임워크 Kelos를 오픈소스로 공개했어요. 국내 빅테크가 에이전트 인프라 영역에 직접 기여하는 사례로 주목할 만해요.
6월 25일 AI 브리핑
OpenAI가 Broadcom과 함께 자체 개발한 첫 번째 추론 칩 '할라피뇨'를 공개했어요. 이는 AI 업계의 하드웨어 자립 경쟁을 본격화하는 신호탄이에요. Anthropicが 알리바바의 불법 모델 접근을 주장하고, NSA가 Anthropic과의 분쟁으로 모델 접근권을 잃으면서 AI 모델 보안과 기업-정부 관계가 새로운 갈등 국면에 접어들었어요. Qualcomm이 약 40억 달러에 Modular를 인수하며 AI 인프라 경쟁이 반도체 성능을 넘어 소프트웨어 플랫폼 주도권 싸움으로 진화하고 있어요. 기업들이 AI 예산 폭발을 막기 위한 토큰 사용량 통제에 나서면서 '토큰 배급 시대'가 시작됐다는 분석이 나오고 있어요.
- OpenAI 자체 칩 공개와 AI 하드웨어 독립 경쟁
- AI 모델 보안·접근권 갈등 심화
- 기업 AI 비용 관리 위기
- 오픈AI·브로드컴, 자체 개발 'AI 추론 칩' 공개… "9개월 만에 테이프아웃"
OpenAI가 Broadcom과 협력해 9개월 만에 자체 추론 칩 '할라피뇨'를 완성했어요. 클라우드 의존 탈피와 추론 비용 절감을 동시에 노리는 역대급 하드웨어 도전이에요.
- Anthropic Accuses Alibaba of 'Illicitly' Accessing AI Models
Anthropic이 알리바바의 자사 AI 모델 불법 접근을 공개 주장했어요. AI 지적재산권과 모델 보안을 둘러싼 업계 최대 규모의 법적 분쟁으로 번질 수 있어요.
- NSA Lost Access to Powerful A.I. Model Amid Anthropic Dispute
NSA가 Anthropic과의 분쟁으로 강력한 AI 모델 접근권을 잃었어요. AI 기업과 정부 간 관계의 복잡성과 AI 자산의 전략적 가치를 단적으로 보여주는 사건이에요.
- Qualcomm Buys Buzzy Chip Startup Modular for Nearly $4 Billion
Qualcomm이 AI 칩 소프트웨어 스타트업 Modular를 약 40억 달러에 인수했어요. AI 인프라 경쟁이 반도체 성능에서 소프트웨어 플랫폼 통합 전략으로 축이 이동하고 있어요.
- Companies are scrambling to stop employees from maxing out AI budgets with small tasks
기업들이 직원들의 무분별한 AI 사용으로 예산이 소진되자 토큰 사용량 제한 정책을 도입하기 시작했어요. AI 도입 초기 '무제한 사용' 시대가 끝나고 비용 효율 관리 시대가 열리고 있어요.
- "미소스가 미국 정부 기밀 시스템서 취약점 발견"…규제 논란도 확산
Anthropic의 AI 미소스가 미국 정부 고보안 시스템에서 취약점을 몇 시간 만에 발견했어요. AI의 사이버 보안 역량이 입증됐지만, 이를 둘러싼 규제 논쟁도 확산되고 있어요.
- ‘AI 협업시대’ 앤트로픽이 공개한 ‘클로드 태그’
Anthropic이 클로드에 '태그' 기능을 추가해 다중 에이전트 워크플로우 관리를 체계화했어요. 에이전트 간 협업이 일상화되는 시대를 앞두고 오케스트레이션 도구 경쟁이 본격화되고 있어요.
- Computer use in Gemini 3.5 Flash
Google이 Gemini 3.5 Flash에 컴퓨터 직접 제어 기능을 추가했어요. 화면을 보고 마우스·키보드를 조작하는 'Computer Use' 기능이 주요 모델들에 기본 탑재되는 흐름이 가속되고 있어요.
- 마이크론, AI 수요에 사상 최대 실적…매출 전년 대비 4.5배 급증
마이크론이 AI 수요 급증으로 매출이 전년 대비 4.5배 오르며 사상 최대 실적을 기록했어요. AI 인프라 투자 열기가 메모리 반도체 시장까지 강력하게 끌어올리고 있어요.
- 화웨이-차이나모바일, 통신사 최초 AI 추론 가속 검증 성공…장문맥 처리 성능 최대 372% 향상
화웨이·차이나모바일이 상용망에서 AI 추론 가속 검증에 성공하고 토큰 처리량을 최대 372% 끌어올렸어요. 미·중 AI 인프라 기술 경쟁이 하드웨어를 넘어 통신망 수준까지 확대되고 있어요.
- [anthropics/claude-code] v2.1.191
Claude Code v2.1.191이 CPU 사용량 37% 절감, 메모리 누수 해결, MCP 서버 안정성 개선을 담아 업데이트됐어요. 코딩 에이전트 성능의 실질적 완성도가 높아지고 있어요.
- Why big AI labs are hiring so many philosophers
OpenAI, Anthropic 등 대형 AI 연구소들이 철학자 채용을 대폭 늘리고 있어요. AI 안전·정렬 문제가 기술 문제를 넘어 철학적 질문으로 다뤄지기 시작했다는 신호예요.
- A specialized reasoning large language model for accelerating rare disease diagnosis: a randomized AI physician assistance trial
희귀질환 진단 특화 32B LLM RaDaR가 임상 시험에서 의사의 진단 정확도를 21%p 높이고 진단 시점을 평균 1.87개월 앞당겼어요. 의료 AI의 실질적 임상 효용이 처음으로 무작위 비교 시험으로 입증됐어요.
- Kelos - 쿠버네티스 네이티브 자율 코딩 에이전트 프레임워크
네이버가 쿠버네티스 네이티브 자율 코딩 에이전트 프레임워크 Kelos를 오픈소스로 공개했어요. 국내 빅테크가 에이전트 인프라 영역에 직접 기여하는 사례로 주목할 만해요.