2024년 10월 5주 AI 단신

SKT 텔레콤은 AI 서비스 ‘에이닷’을 모바일에서 PC로 확대하였다. 이번 PC 버전 출시로 다양한 브라우저를 통해 접근할 수 있게 되었다.
카카오는 새로운 AI 서비스 ‘Kanana’를 공개하였다. 카나나 서비스는 AI 메신저로서 사용자의 대화를 학습하고 개인화된 답변을 제공하는 것을 핵심 기능으로 갖고 있다.
OpenAI와 Microsoft가 협력하여 5개 주요 뉴스 매체에 AI 저널리즘 도구에 대한 소프트웨어 크레딧과 함께 1,000만 달러의 지원금을 제공할 예정이다.
OpenAI는 ‘ChatGPT’ 기업 및 대학용 사용자가 100만명을 돌파했다고 밝혔다. 이는 기업용 사용자가 반년 만에 70%가량 늘어난 것이다. 그러나 OpenAI는 몇개의 기업이 ChatGPT, 유료 버전을 사용하지는 밝히지 않았다. 이를 통해 오픈AI의 연간 수익은 40억달러를 달성한 것으로 알려졌다.
Miles Brundage는 저작권이 있는 자료를 사용하는 것은 법을 위반하고 인터넷과 콘텐츠 제작자에게 해를 끼친다며 회사를 떠났으며, OpenAI는 AI 안전에 초점을 맞춘 AGI 준비 팀을 해체하였다.
TED AI 컨퍼런스에서 OpenAI의 Noam Brown은 인간의 문제 해결과 유사한 느리고 숙고적인 추론 방식인 ‘시스템 2 사고’를 통합한 새로운 o1 모델의 혁신적 잠재력에 대해 설명하였다. Libratus와 CICERO와 같은 획기적인 AI 연구로 유명한 브라운은 이 새로운 모델이 데이터와 컴퓨팅 성능에 초점을 맞춘 기존의 확장 방식을 뛰어넘는 방법에 대해 설명하였다. 대신, o1의 설계는 전략적, 상황별 의사 결정을 장려하여 의료, 에너지, 금융과 같은 산업의 복잡한 애플리케이션에 이상적이다. 브라운은 현재 AI의 발전은 데이터와 컴퓨팅 용량의 확장에 힘입은 바가 크다고 강조하였다. 하지만 그는 복잡한 문제를 효과적으로 해결하기 위해서는 AI가 더 심층적인 추론 능력을 갖춰야 한다고 생각하고 있다.
구글 DeepMind는 AI가 생성한 텍스트에 워터마킹 시스템인 SynthID-Text를 도입하였다. Google의 Gemini 챗봇과 통합된 이 도구는 AI의 출력을 미세하게 수정하여 특정 도구로만 감지할 수 있는 통계적 워터마크를 삽입하며, 현재 일부 개발자와 기업에서 사용할 수 있다. 그러나 SynthID의 워터마크가 완벽한 것은 아니며 텍스트 변경으로 인해 워터마크가 가려질 수 있다.
구글은 12월에 Gemini 2.0을 사용해 Chrome 내에서 웹 기반 작업을 자동화하는 새로운 AI 기반 에이전트인 프로젝트 Jarvis를 공개할 예정이다. 아이언맨의 J.A.R.V.I.S.에서 영감을 받은 Google의 프로젝트 Jarvis는 브라우저 내에서 상호작용을 자동화하여 검색, 항공권 예약, 쇼핑과 같은 일상 활동을 간소화하도록 설계된 소비자 중심 도구이다. 이 도구는 스크린샷을 자주 찍어 해석한 다음 클릭이나 입력과 같은 작업을 실행하는 방식으로 작동한다. 각 단계 사이에 처리 시간이 필요하기 때문에 현재 Jarvis는 디바이스 내 리소스가 아닌 클라우드 기반 성능에 의존하여 느리게 작동한다.
Microsoft는 고객이 최소한의 코딩만 필요한 도구인 Copilot Studio를 통해 자율 AI 에이전트를 만들 수 있도록 할 예정이다. 이러한 자율 에이전트는 기존 챗봇과 달리 독립적으로 작동하여 고객 문의, 영업 리드 식별, 재고 관리와 같은 작업을 처리할 수 있다. Microsoft는 이 도구를 사용하여 고객 상호 작용을 관리하는 에이전트를 개발하기 위해 McKinsey & Co.와 파트너십을 맺었다.
Microsoft는 자사의 Dynamics 365 플랫폼용 새로운 자율 AI 에이전트 제품군을 출시하여 최근 경쟁이 치열한 엔터프라이즈 AI 시장에서 Salesforce의 에이전트포스 플랫폼과 경쟁에 나섰다. 다음 달 공개 프리뷰를 앞두고 있는 Microsoft의 새로운 AI 에이전트 10종은 영업, 재무, 공급망 관리와 같은 다양한 비즈니스 기능을 지원하도록 설계되었다. 기존 챗봇과 달리 이 AI 에이전트는 고급 언어 모델을 활용하여 의도와 맥락을 해석하여 비즈니스 프로세스 전반에서 보다 의사 결정과 자동화가 가능하다.
최근 출시된 Claude 3.5 Sonnet에는 컴퓨터 제어라는 획기적인 AI 기능이 도입되었다. 이제 특정 설정을 통해 Claude는 커서를 움직이고, 클릭하고, 타이핑하는 등 사람과 상호작용하는 것처럼 명령을 따라 컴퓨터를 제어할 수 있게 되었다. 이 기능은 현재 공개 베타 버전으로, 사용자가 직접 AI 컴퓨터 제어를 경험할 수 있다.
Meta는 ‘AI 비서’ 목소리에 인간과 같은 감정과 톤을 담을 수 있는 새로운 오픈 소스 모델 ‘Meta Spirit LM’을 출시하였다. 이는 GPT-4o의 ‘고급 음성 모드(AVM)’에 대응이라 할 수 있다. 이 모델은 Spirit LM Base와 Spirit LM Expressive의 두가지 버전으로 구성되어 있다. Base 모델은 단순한 음성 전환 모델이지만, Expressive는 톤이나 감정, 피치와 같은 인간 목소리의 뉘앙스를 그대로 반영한다.
Meta는 PDF를 팟캐스트로 변환하는 오픈 소스 NotebookLlama를 공개하였다.
Meta가 AI 검색 엔진을 개발 중이다. 이는 사용자가 구글 검색 및 MS 빙에 대한 의존도를 낮추려는 의도로 해석되며, Perplexity나 OpenAI 등에 이어 AI 검색 경쟁에 뛰어들었다. Meta의 AI 검색 엔진 팀은 8개월 이상 온라인상 데이터베이스로 구성하는 ‘웹 인덱싱’ 작업을 진행해 왔다. Meta가 이미 출시한 ‘웹 크롤링 봇’도 웹 인덱싱을 위해 웹 페이지를 뒤지며 각종 정보를 자동으로 수집하는 용도로 사용된 것으로 보이고 있다.
X는 타사 ‘협력자’가 X 사용자 데이터를 사용하여 AI 모델을 학습할 수 있도록 개인정보 보호정책을 업데이트 하였으며, 사용자에게는 옵트아웃 옵션을 제공할 예정이다. 이전에는 엘론 머스크의 xAI 챗봇인 Grok만이 이 데이터를 사용했으며, 이로 인해 EU의 조사를 받았다. 이번 업데이트는 X가 AI 회사에 라이선스를 부여하여 Reddit과 같은 플랫폼과 유사하게 데이터를 수익화할 수 있음을 시사한다.
xAI가 모델 ‘Grok’의 API를 공식 출시하였다. xAI의 API 문서에 따르면 개발자들은 xAI가 지난 8월 출시한 최신 모델 ‘Grok-2’와 ‘Grok-2 미니’에 접근할 수 있다. 또 API는 함수 호출 기능을 지원해 Grok을 데이터베이스나 검색 엔진과 같은 외부 도구에 연결할 수 있다. 아직 API를 통해 구매 가능한 모델은 ‘grok-beta’로 표시되어 있다. xAI의 API 가격은 100만개의 입력 토큰당 5달러 또는 100만개의 출력 토큰당 15달러이다. 이는 OpenAI의 ‘GPT-4o’ API 보다 비싸며, 각각 15달러와 60달러인 OpenAI의 ‘o1-프리뷰’ 보다는 저렴하다.
Grok에 비전 기능이 추가되었다. 이제 웹과 모바일에서 업로드할 수 있다.
Apple은 Genmoji, Image Playground, Visual Intelligence, Image Wand, 그리고 ChatGPT가 통합된 새로운 개발자 베타 버전을 IOS 18에 출시하였다.
Runway는 3세대 알파 플랫폼에서 단순한 동영상 입력을 표현력 있는 캐릭터 애니메이션으로 변환하는 Act-One을 출시하였다.
Stability AI은 새로운 버전의 Stable Diffusion 3.5을 내 놓았다. 이번 공개 릴리스는 Stable Diffusion 3.5 Large, Stable Diffusion 3.5 Large Turbo와 Stable Diffusion 3.5 Medium을 포함한 여러 모델 을 포함하고 있다. 이들 모델은 크기에 맞게 고도로 사용자 정의를 할 수 있고, 소비자 하드웨어에서 실행되며, 허용되는 Stability AI 커뮤니티 라이선스에 따라 상업적 및 비상업적 용도로 모두 무료로 사용할 수 있다. 모든 Stable Diffusion 3.5 모델은 Hugging Face와 GitHub에서 다운로드 할 수 있다.
Midjourney는 모든 이미지를 편집할 수 있는 생성 AI 도구를 출시할 예정이다. 이는 기존 Midjourney 생성 이미지 전용의 기능을 넘어서는 것이다. 이번 업데이트된 편집기는 Midjourney로 생성한 이미지를 넘어, 모든 웹 이미지를 편집할 수 있다. 프롬프트를 이용하여 이미지 내 객체를 변경하고 색상과 세부 사항을 재구성할 수 있다.
잘 알려지지 않은 이미지 생성 AI 모델 ‘red_panda’가 주목을 받고 있다. 여러 모델을 제치고 Artificial Analysis의 이미지 리더보드에서 1위에 올랐으며, 어느 회사의 제품인지에 대해 추측이 난무하고 있다. 많은 X 사용자는 모델 이름을 들어 중국의 유력한 AI 연구소에서 개발했을 것으로 추측하고 있다.
스캐터랩은 스토리 콘텐츠 생성 AI 플랫폼 ‘zeta’가 출시 6개월 만에 누적 이용자 100만명을 돌파하였다고 한다. 제타는 9월 한달 간 이용자들의 발화량이 9억7000만건을 기록하였다. 인기 이유로 AI 캐릭터 생성 뿐만 아니라 대화와 지문을 통해 스토리를 전개하는 과정에서 창작자 의도가 반영되기 때문에 일반 사용자도 제타에서 인기 캐릭터를 만들 수 있다는 점을 들고 있다.
최근 해고된 인턴이 자사의 AI 프로젝트에 막대한 피해를 입혔다는 소문에 대해 바이트댄스는 해명에 나섰다. 바이트댄스는 해당 인턴이 내부 AI 교육 작업을 방해한 것은 사실이지만 바이트댄스의 핵심 상용 프로젝트나 주요 AI 모델에는 영향을 미치지 않았으며 수천만 달러의 재정적 손실이 발생했다는 주장은 과장된 것이라고 해명하였다.
Metaview가 개발한 hiring.studio는 면접 질문을 생성하는 AI 보조 파일럿이다.
Mira Murati 전 OpenAI CTO는 새로운 AI 스타트업을 설립하고 AI 모델 개발을 위해 1억 달러 이상의 벤처 자금을 모집한다.

people found this article helpful. What about you?

##AI #단신