AI의 지금까지의 해: ChatGPT에서 Gemini까지 가장 큰 이야기와 앞으로 나올 내용

게시 됨: 2024-07-02

지난 몇 년 동안의 생성적 AI 폭발은 2024년에도 둔화되지 않았습니다. 대규모 언어 모델을 사용하는 수많은 신제품이 있었고 기존 서비스를 위한 일부 새로운 기능이나 도구가 거의 매일 폭발했습니다.

ChatGPT는 더욱 강력하고 새로운 음성 모드를 제공하며, Google Gemini는 Gmail에서 Google 드라이브까지 모든 곳에 나타나며 심지어 Apple도 마침내 AI(또는 Apple Intelligence) 분야에 뛰어들었습니다.

그런 다음 Suno에서 Rabbit까지 자체 AI 모델과 시장의 주류가 구축한 AI 모델을 활용하는 혁신적인 방법을 찾고 있는 스타트업이 있으며 올해 남은 기간 동안 더 많은 기대를 받고 있습니다.

2024년이 정확히 절반에 이르렀으므로 우리는 오늘 당장 플레이할 수 있는 올해의 가장 인상적이고 주목할 만하며 악명 높은 AI 릴리스 중 일부를 선택했습니다. 그 아래에는 아직 출시되지 않았지만 연말 이전에 출시될 AI 혁신 몇 가지를 더 선정했습니다.

2024년 AI: 올해 지금까지 가장 중요한 출시는 무엇입니까?

토끼 R1 검토

(이미지 출처: 미래)

채팅GPT

ChatGPT는 대규모 언어 모델을 사용하는 생성 AI 제품의 물결을 나타내는 기본 용어였습니다. 그러나 OpenAI는 경쟁 우위를 유지하기 위해 이에 의존하지 않았으며 올해 AI 챗봇과 연결된 서비스를 정기적으로 확대해 왔습니다.

2024년에 ChatGPT는 이전 상호 작용을 기반으로 동작을 조정할 수 있는 메모리 기능과 이러한 답변을 37개 언어 및 5개 음성의 오디오 성능으로 변환하는 소리내어 읽기 기능을 추가했습니다. 사용자 정의는 또한 1월에 출시된 GPT 스토어의 핵심입니다. 여기서 사용자는 특정 작업에 초점을 맞춘 ChatGPT의 사용자 정의 버전을 구축하고 플레이할 수 있습니다.

덜 좋은 소식으로 OpenAI는 'Sky' 목소리가 영화 Her 의 여배우 목소리와 유사하다는 이유로 Scarlett Johansson과 공개적으로 논쟁을 벌였으며 이후 계획된 음성 모드 업그레이드를 "가을"로 연기해야 ​​했습니다. ChatGPT도 6월에 몇 차례 큰 중단을 경험했습니다.

구글 제미니

연초에 Google Gemini는 Google이 만든 모델 제품군만 언급했습니다. 2월이 되어서야 Google은 기존에 사용했던 Bard 브랜드를 폐기하고 모든 생성 AI 프로젝트를 Gemini의 산하에 두었습니다.

이러한 새롭고 향상된 기능 중 일부는 이미지 생성 도구(일부 이상한 환각 문제 이후 잠시 중단됨)와 GPT 스토어와 같은 맞춤형 챗봇을 제공하는 Gems 스토어를 통해 ChatGPT를 따라잡는 것으로 보입니다.

그렇지 않으면 최근 몇 달 동안 사용하는 다른 모든 Google 제품에서 Gemini를 볼 수 있습니다. 즉, 이메일 작성, 사진 주석 달기, Android 휴대전화의 보조자 역할을 맡을 수 있습니다.

토끼 R1

Rabbit R1은 지난 1월 주머니 크기의 200달러 생성 AI 장치가 출시되면서 CES 2024를 강타했으며, 회사는 소형 터치스크린, 360도 카메라, Perplexity AI의 대형 지원 장치로 수행할 수 있는 작업을 선보이며 찬사를 받았습니다. 실시간 답변을 위한 언어 모델. 월간 구독료가 없어 접근성이 더 좋아 보였고 매출도 압도적이었습니다.

그러나 일관되지 않은 배터리 수명, 때로는 느린 성능, 여전히 제한된 기능 세트 및 기타 결함을 포함한 Rabbit R1의 현실은 여전히 ​​중요하고 올바른 구매 가치가 있지만 향후 하드웨어에 대한 경고 이야기가 될 수 있습니다. 사용자.

인간적인 AI 핀

Rabbit R1과 마찬가지로 Humane AI Pin은 CES 2024에서 많은 주목을 받은 웨어러블 장치입니다. 항상 켜져 있는 생성형 AI 기반 보조 장치가 옷에 부착되어 음성 명령과 녹음 및 녹음을 통해 실시간 정보를 제공할 것을 약속합니다. 하루 종일 상호 작용과 회의를 분석하십시오.

당연한 것처럼, 시끄러운 환경에서 음성 인식의 신뢰성 문제는 말할 것도 없고 지속적인 청취 기능을 고려할 때 즉각적인 개인 정보 보호 문제가 많이 있었습니다. 이러한 단점에도 불구하고 빠르게 매진됐으나 현재 휴메인이 구매자를 찾고 있는 것으로 알려졌다.

스노

올해 가장 큰 AI 이야기 중 하나는 궁극적으로 Suno 및 Udio와 같은 AI 음악 생성기가 될 수 있습니다. 두 사람 모두 간단한 텍스트 프롬프트에서 가사, 보컬, 악기 연주로 완성된 무난한 곡을 만들어내는 인상적인 능력을 갖고 있을 뿐만 아니라, 현재 미국 음반산업협회(RIAA) 업계가 두 사람 모두 저작권 침해로 소송을 제기하고 있기 때문입니다.

이 소송은 AI 음악 생성기와 생성 AI 전체에 큰 영향을 미칠 수 있습니다. 방대한 양의 데이터에 대해 새로운 AI 도구를 훈련시키는 저작권 보유자와 스타트업 사이에 폭풍이 몰아치고 있으며, 이 법적 싸움이 어디로 향할지 보는 것은 흥미로울 것입니다. 이를 뒷받침하는 규제 프레임워크와 그에 수반되는 법률의 생성 속도가 빨라질 수 있지만 그때까지 Suno와 Udio는 AI로 생성된 곡을 계속 만들 수 있습니다.

2024년의 AI: 올해 남은 기간 동안 어떤 출시가 예상되나요?

Apple의 Craig Federighi가 2024년 WWDC(Worldwide Developers Conference)에서 Apple Intelligence를 소개하고 있습니다.

(이미지 출처: 애플)

애플 인텔리전스

Apple Intelligence는 올해 남은 기간 동안 가장 기대되는 AI 기능 세트입니다. Apple의 WWDC 2024 이벤트에서는 이 '개인 지능' 시스템이 iOS 18, iPadOS 18 및 macOS Sequoia에 출시될 것임을 밝혔습니다. Apple의 자체 모델을 ChatGPT 및 기타 AI 플랫폼과 결합하는 경우(귀하의 승인 하에) Apple Intelligence는 상황에 대한 더 나은 안내와 이해를 통해 Siri를 보조자로서 강화하는 역할을 합니다.

이는 화면 인식과 결합되어 메시지의 주소를 연락처 카드에 추가하는 등 화면의 정보와 관련된 작업을 수행할 수 있으며 기타 수백 가지 작업을 수행할 수 있습니다. 동일한 AI를 사용하면 이메일과 메시지를 작성하고, 오디오 파일을 요약하고, Image Playground 기능을 사용하여 이미지를 생성 및 편집할 수 있습니다. Genmoji 기능을 사용하면 독창적인 이모티콘을 만들 수도 있습니다.

2024년 말 미국에서 출시될 때 사용하려면 M 시리즈 iPad 또는 Mac, iPhone 15 Pro 또는 15 Pro Max 이상이 필요하므로 업그레이드가 필요할 수 있습니다.

아마존 알렉사

Amazon은 생성 AI의 기업 측면에서 많은 활동을 해왔지만 오랫동안 음성 AI 비서의 대명사였던 Alexa는 ChatGPT 및 기타 기능과 관련된 AI 업그레이드의 일부만을 수행했습니다. 올해는 변경될 수 있지만 추가 비용이 발생할 수 있습니다.

올해 '리마커블 알렉사'라는 제품이 나올 것이라는 소문이 돌고 있습니다. 생성적 AI 기능을 통합하고, 단일 명령으로 여러 작업을 처리하고, 심지어 음식 배달 주문도 할 수 있습니다.

전망

제너레이티브 AI는 특히 소비자 중심 제품의 경우 여전히 개발 중인 분야입니다. 내년에는 더욱 성숙한 상업 생태계가 있을 수 있지만 현재 경쟁은 더 큰 이름을 위한 새로운 기능에 관한 것이며 다른 사람들은 사용 가능한 모델을 사용하는 새로운 방법을 모색합니다. 따라서 이는 적어도 현재로서는 소프트웨어 구독과 의심스러운 하드웨어를 의미합니다.