5월 21일부터 23일까지 시애틀과 온라인에서 개최되는 마이크로소프트(NASDAQ:MSFT)의 연례 빌드 컨퍼런스(Build conference)에서는 획기적인 AI 도구 및 개선 사항 제품군을 공개했다.
전 세계 개발자들이 모인 이번 행사에서는 마이크로소프트의 AI 제품에 대한 중요한 업데이트와 함께 인공 지능에 중점을 두었다.
마이크로소프트의 CEO인 사티아 나델라(Satya Nadella)는 빌드 2024에서 회사의 오랜 포부를 설명하며 “우리가 컴퓨터를 이해해야 하는 대신 컴퓨터가 우리를 이해할 수 있을까?”와 “컴퓨터가 모든 정보를 바탕으로 더 효과적으로 사고하고, 계획하고, 행동하도록 도울 수 있을까?”라고 말했다. 나델라는 이러한 꿈에 대한 해답으로 AI를 제시했다.
마이크로소프트의 CTO이자 AI 담당 EVP인 케빈 스콧(Kevin Scott)은 현재의 AI 발전을 과거의 기술 혁명에 비유하면서 “우리는 PC 진화 및 광대역 인터넷과 유사한 특별한 플랫폼 물결을 타고 있다”고 말했다.
그는 AI 제품의 빠른 개발을 가능하게 한 도구로 마이크로소프트의 코파일럿(Copilot) 스택을 강조했다. 스콧은 “우리가 AI 모델을 얼마나 강력하게 만들 수 있는지에 대해 아직 갈 길이 멀다”고 말했다.
다음은 컨퍼런스에서 발표된 꼭 봐야 할 5가지 AI 도구 및 개선 사항이다.
1. 파이-3-비전: 마이크로소프트의 멀티모달 모델
마이크로소프트는 이미지를 이해하고 텍스트를 처리할 수 있는 소형 언어 모델인 ‘파이3 비전(Phi-3-Vision)’을 공개했다. 이 모델은 모바일 기기에 이상적이다.
현재 프리뷰 단계에 있는 이 모델은 42억 개의 매개변수를 자랑하며, 차트 해석 및 이미지 관련 질문에 답하는 등의 시각적 추론 작업에서 뛰어난 성능을 발휘한다.
2. 기업을 위한 코파일럿 AI 에이전트
마이크로소프트는 AI 기반의 코파일럿(Copilot) 에이전트를 도입하여 비즈니스 운영 방식을 혁신하고 있다.
이 가상 직원들은 이메일 수신함 모니터링 및 데이터 입력과 같은 작업을 자동화하여 인간 직원들이 보다 전략적인 활동에 집중할 수 있도록 시간을 확보해 준다. 이러한 수동적인 AI 에이전트에서 능동적인 AI 에이전트로의 전환은 직장에서의 AI 활용에 있어 중요한 발전을 나타내며, 더 효율적이고 자율적인 운영을 가능하게 한다.
3. 애저 오픈AI 상의 GPT-4o
오픈AI의 최신 모델인 GPT-4o는 이제 마이크로소프트의 애저(Azure) 오픈AI 서비스를 통해 사용할 수 있다.
이 멀티모달 모델은 입력과 출력을 모두 지원하며, 대화형 AI 기능을 향상시키기 위해 애플리케이션에 통합될 수 있다. 개발자들은 이 GPT-4o를 사용하여 더 많은 대화형 애플리케이션을 만들 수 있어, 이는 대화형 AI가 어떤 것을 성취할 수 있는지의 한계를 넓히게 된다.
4. 윈도우 코파일럿 플러스 PC
마이크로소프트는 Arm 기반 프로세서와 고급 AI 기능을 갖춘 새로운 라인업인 코파일럿 플러스(Copilot Plus) PC를 출시했다.
이 PC들은 윈도우 11에서 실행되는 40개 이상의 AI 모델을 포함한 윈도우 코파일럿 런타임(Windows Copilot Runtime)을 탑재하고 있다. 이 런타임은 개발자들에게 온디바이스 모델을 활용한 AI 애플리케이션을 구축할 수 있는 API 및 툴체인 라이브러리를 제공한다. 프리즘(Prism)이라는 에뮬레이션 레이어의 포함으로 x86 앱과의 원활한 호환성이 보장되어 전체적인 사용자 경험을 향상시킨다.
5. 리콜: 개인의 역사학자
마이크로소프트의 혁신적인 리콜(Recall) 기능은 사용자가 PC와 상호 작용하는 방식을 변화시킬 예정이다.
퀄컴의 스냅드래곤 X 엘리트(Snapdragon X Elite) 칩이 탑재된 새로운 코파일럿 플러스 PC에서 사용할 수 있는 리콜은 사용자가 PC에서 본 적이 있거나 한 적이 있는 모든 정보를 검색하고 가져올 수 있다. 개인 사학자처럼 작동하는 이 도구는 사용자가 과거 활동과 데이터를 손쉽게 접근할 수 있도록 하여 생산성과 정보 관리를 크게 향상시킨다.
마이크로소프트의 빌드 2024 컨퍼런스는 AI 기술의 한계를 넓히기 위한 회사의 노력을 강조했다.
파이-3-비전과 자율 AI 에이전트에서부터 고급 대화 모델 및 혁신적인 PC 기능에 이르기까지 마이크로소프트는 개인 및 전문 경험을 향상시키는 AI 기반 도구의 새로운 시대를 열고 있다.
AI가 계속해서 진화함에 따라 이러한 도구들은 기술의 미래와 그 응용 분야를 형성하는 데 중요한 역할을 할 것이다.
다음 읽을거리: 마이크로소프트 CEO, GPT-4o가 애저 AI에서 일반적으로 사용 가능하다고 발표; 애저 AI 스튜디오도 사용 가능
사진: 셔터스톡