AD
구글 클라우드가 추론에 특화된 7세대 TPU(텐서 처리 장치) '아이언 우드'(Ironwood)를 공개했습니다.
TPU는 인공지능(AI) 딥러닝(심층 학습)에 최적화된 칩으로, 챗봇·코드, 미디어 콘텐츠 생성 등 다양한 AI 처리 요구량에 맞게 확장할 수 있는 게 특징입니다.
구글 클라우드는 아이언 우드가 "현재까지 개발된 TPU 중 가장 크고 강력한 성능을 자랑한다"며 "제미나이 2.5 같은 사고 모델의 기하급수적인 연산 요구를 충족할 수 있다"고 설명했습니다.
전력 효율성과 용량도 기존 모델과 비교해 대폭 개선됐습니다.
아이언 우드는 지난해 공개된 6세대 TPU '트릴리움' 대비 전력 성능이 2배 높다고 구글 클라우드는 전했습니다.
아이언 우드의 HBM(고대역폭 메모리) 용량은 트릴리움보다 6배 큽니다.
엔비디아에 대한 AI 칩 의존도를 줄이려는 테크 업계의 움직임이 본격화하는 가운데 구글 클라우드의 칩에 대한 시장 수요가 증가할지에도 관심이 쏠립니다.
구글 클라우드는 아울러 네트워크 성능을 최대 40% 높인 '클라우드 와이드 아레나 네트워크'(Cloud WAN)를 전 세계 지역에 제공한다고 밝혔습니다.
해당 네트워크는 육상·해저 케이블로 연결된 구글 클라우드 인프라 서비스 지역에서 속도 지연 문제가 거의 없는(latency-free) 인프라를 제공할 수 있다고 구글 클라우드는 전했습니다.
사내 구축형 환경에서도 AI 모델 '제미나이' API(응용 프로그램 인터페이스)를 활용할 수 있다는 소식도 전했습니다.
구글은 버텍스 AI 확장을 통한 멀티 에이전트 생태계 구현 계획도 발표했습니다.
버텍스 AI는 기업 사용자가 AI 모델을 훈련·배포하고, 거대 언어 모델(LLM)을 활용한 AI 앱 개발을 지원하는 플랫폼입니다.
복잡한 멀티 에이전트 시스템을 간편하게 구축할 수 있는 '에이전트 개발 키트'(ADK), 에이전트 간 통신이 가능한 개방형 프로토콜 등 AI의 혁신 기능을 지원한다고 구글 클라우드는 전했습니다.
이런 가운데 미국 라스베이거스 만달레이 베이 컨벤션 센터에서 현지 시각 9일부터 사흘간 연례 기술 콘퍼런스인 '구글 클라우드 넥스트 2025'가 진행되고 있습니다.
구글 클라우드는 싱가포르 정부, 로레알 그룹, 레딧, 삼성 등 500여 곳의 고객 사례를 통해 구글 AI를 통한 사업 성과를 소개할 예정입니다.
YTN 이승윤 (risungyoon@ytn.co.kr)
※ '당신의 제보가 뉴스가 됩니다'
[카카오톡] YTN 검색해 채널 추가
[전화] 02-398-8585
[메일] social@ytn.co.kr
[저작권자(c) YTN 무단전재, 재배포 및 AI 데이터 활용 금지]
TPU는 인공지능(AI) 딥러닝(심층 학습)에 최적화된 칩으로, 챗봇·코드, 미디어 콘텐츠 생성 등 다양한 AI 처리 요구량에 맞게 확장할 수 있는 게 특징입니다.
구글 클라우드는 아이언 우드가 "현재까지 개발된 TPU 중 가장 크고 강력한 성능을 자랑한다"며 "제미나이 2.5 같은 사고 모델의 기하급수적인 연산 요구를 충족할 수 있다"고 설명했습니다.
전력 효율성과 용량도 기존 모델과 비교해 대폭 개선됐습니다.
아이언 우드는 지난해 공개된 6세대 TPU '트릴리움' 대비 전력 성능이 2배 높다고 구글 클라우드는 전했습니다.
아이언 우드의 HBM(고대역폭 메모리) 용량은 트릴리움보다 6배 큽니다.
엔비디아에 대한 AI 칩 의존도를 줄이려는 테크 업계의 움직임이 본격화하는 가운데 구글 클라우드의 칩에 대한 시장 수요가 증가할지에도 관심이 쏠립니다.
구글 클라우드는 아울러 네트워크 성능을 최대 40% 높인 '클라우드 와이드 아레나 네트워크'(Cloud WAN)를 전 세계 지역에 제공한다고 밝혔습니다.
해당 네트워크는 육상·해저 케이블로 연결된 구글 클라우드 인프라 서비스 지역에서 속도 지연 문제가 거의 없는(latency-free) 인프라를 제공할 수 있다고 구글 클라우드는 전했습니다.
사내 구축형 환경에서도 AI 모델 '제미나이' API(응용 프로그램 인터페이스)를 활용할 수 있다는 소식도 전했습니다.
구글은 버텍스 AI 확장을 통한 멀티 에이전트 생태계 구현 계획도 발표했습니다.
버텍스 AI는 기업 사용자가 AI 모델을 훈련·배포하고, 거대 언어 모델(LLM)을 활용한 AI 앱 개발을 지원하는 플랫폼입니다.
복잡한 멀티 에이전트 시스템을 간편하게 구축할 수 있는 '에이전트 개발 키트'(ADK), 에이전트 간 통신이 가능한 개방형 프로토콜 등 AI의 혁신 기능을 지원한다고 구글 클라우드는 전했습니다.
이런 가운데 미국 라스베이거스 만달레이 베이 컨벤션 센터에서 현지 시각 9일부터 사흘간 연례 기술 콘퍼런스인 '구글 클라우드 넥스트 2025'가 진행되고 있습니다.
구글 클라우드는 싱가포르 정부, 로레알 그룹, 레딧, 삼성 등 500여 곳의 고객 사례를 통해 구글 AI를 통한 사업 성과를 소개할 예정입니다.
YTN 이승윤 (risungyoon@ytn.co.kr)
※ '당신의 제보가 뉴스가 됩니다'
[카카오톡] YTN 검색해 채널 추가
[전화] 02-398-8585
[메일] social@ytn.co.kr
[저작권자(c) YTN 무단전재, 재배포 및 AI 데이터 활용 금지]