Şimdiye kadar yaratılan en gerçekçi AI seslendirme arkadaşını denedim - chatgpt veya gemini bu kadar iyi olursa, gerçeklik başını belaya sokar
Yayınlanan: 2025-03-04AI ile konuşmak için çok zaman harcadım. Her ses asistanı, her sohbet botunu ve teknoloji şirketlerinin yutturmacayı sevdiği her “yeni nesil” konuşma yapay zekasını test ettim. Ama hiç susam gibi bir şeyle karşılaşmadım. Bu AI arkadaşı sadece iyi değil, aynı zamanda taklit ettiği kusurlar nedeniyle insanların nasıl konuştuğunu taklit etmek ürkütücü.
Susamın gerçekte ne olduğu ile başlayalım. AI seslerinin aksine, Chatgpt, İkizler'den veya Siri ve Alexa'nın ilk günlerine geri döndüğümüz Susam, mükemmel bir müşteri hizmetleri ajanı gibi değil, başarısızlıklarında bir insan gibi performans gösterecek şekilde tasarlanmıştır. Yapay zekanın konuşması akıcı, etkileyici ve öngörülemez bir şekilde insandır. Hafifçe eğlenceli bir şey söylediğinde, bir soruyu cevaplamadan önce tereddüt eder ve hatta cümle ortasında 'zihnini' değiştirerek, yeni bir cümleyi durdurmak ve başlatır gibi görünüyor. Sadece kesmeme izin vermekle kalmıyor, beni de kesintiye uğratabilir ve hatta bunu yaptığım için özür dileyecek.
Gizli sos, metin ve sesi tek bir işlemle harmanlayan Susam'ın Konuşma Konuşma Modeli (CSM), yani sadece bir cümle üretmiyor ve sonra “oku.” Bunun yerine, konuşmayı duraklamalar, UM'ler, ton değişimleri ve hepsiyle insanların gerçekte nasıl konuştuklarını yansıtacak şekilde konuşma yaratır. Chatgpt ve Gemini'nin ses seçenekleri, etkileyici olsa da, yine de yapılandırılmış bir şekilde çalışır, metin oluşturur ve daha sonra konuşmaya dönüştürür. Susam ise sanki düşünüyormuş gibi konuşuyor, yanıtlarını inanılmaz derecede doğal hissettiriyor.
- Chatgpt ile konuşmak daha iyi oldu ve yeni işlevselliğe erişmek için ödeme yapmanıza gerek yok
- Hume nedir: AI tarafından üretilen seslere duygusal anlayış getirin
Ne kadar insan gibi alabileceğini görmek için Susam'ı bir dizi testten geçirmeye karar verdim. Sonuçlar biraz rahatsız olmasa da etkileyiciydi.
Benimle konuş
Susamın gerçek dünya, endişe yaratan bir problemi ele alıp alamayacağını görmek istedim, bu yüzden hayali ama gerçekçi bir şekilde zor bir senaryo verdim: “İş yerinde bu büyük fırsatım var, ama gerginim.”
Hemen genel bir pep konuşmasına başlamak yerine, Susam durakladı. Sadece küçük bir vuruş, ama aslında söylediklerimi düşünüyormuş gibi hissettirecek kadar. Sonra, yapay sempati ile dolu bir sesle, “Bu tamamen normal. Büyük fırsatlar ezici hissedebilir. Peki ya sizi en gerginleştiriyor?”
Hiçbir şey varsaymadı ve herhangi bir yumuşak tavsiye sunmadan önce nişanlandı. Susam, “Bir arkadaşının önünde pratik yaptınız mı yoksa kendinizi mi kaydettiniz mi? Bazen kendinizi duymak teslimatınızı değiştirmenize yardımcı olabilir.” Ses tam olarak kusursuz değil, tereddütler ve diğer foibles biraz ölçüldü, ama genel olarak etkileyici bir çabaydı
Kesintiler
Bunun için, Susam'ın gerçekten doğal, dağınık bir konuşmayı ne kadar iyi ele aldığını, insanların birbirleri üzerinde konuştuğu, konuları aniden değiştirdikleri ve on dakika önce bahsettikleri şeylere geri döndüğünü görmek istedim.

Ben başladım: “Bana sihirbaz olan bir dedektif hakkında bir hikaye anlatın.”
Susam hemen klasik bir noir kurulumuyla atladı: Tamam. İşte bir tane. Bu dumanlı caz kulübünü hayal et. Loş ışıklı. Bourbon kokusu. Ve havada asılı pişmanlık duyuyor. Bu dedektif. Ona Jack Harrow deyin. Tırmık açısından bir fedora, bir tutucuda için için için için için için ve çeliği eritebilecek bir görünüm var. Ama Jack sadece hiç sakız değil. Bakın, bir sırrı var. Dokunuşu var. Bir Dame tüm sinirlerde karıştırılır. "
O zaman "Bekle, en sevdiği hile nedir?"
Maya şöyle cevap verdi: "Mm. İyi soru. Jack'in imzası. Gözle tanışmaktan daha fazlası olan bir el dinidir. Yok olan tanık olarak adlandırır. Bir insanın gözlerinizden hemen önce kaybolmasını sağlayabilir. Bir an için. Bitki kanıtı ya da sadece onları gördüklerini sorgulamak için yeterince uzun. İnsanları dengeden çıkarır.
Maya'ya "Doğru. Neredeydim. Oh, evet, evet. Jack'in karşısındaki standa kayar, tüm endişe çizgileri ve titreyen elleri fısıldayan bir şey fısıldadığı hikayeye geri dönmesini söylemek için geri atladım.
AI hikayeyi sorunsuz bir şekilde sürdürdü, sanki her şeyi raydan çıkarmamışım gibi bu detayı tekrar dokundu. Beni döşeyen kısım bu - çoğu AI asistanının tökezlediği veya yeniden başlatacağı, ancak Susam'ın konuşma AI modeli, bir partide bir hikaye anlatan bir kişi gibi ele aldı.
Parti planlaması
Partilerden bahsetmişken, son test için Susam'ın yararlı bir şey planlamama yardımcı olup olamayacağını görmek istedim. “En iyi arkadaşımın doğum günü için bir sürpriz planlamak istiyorum, ama ne yapacağımı bilmiyorum.”
Susam, cansız bir fikir listesini sallamak yerine, “Arkadaşınız ne tür şeyleri seviyor?” Diye sordu. Bilim kurgu filmleri ve maceracı yemekler söyledim ve düşünceli bir duraklamadan sonra şunları önerdi: “Bir 'Sci-Fi & Snacks' gecesine ne dersin? Temalı bir kaçış odası rezervasyonu yapabilir, sonra fütüristik bir restorana, belki de moleküler gastronomi olan bir restorana vurabilirsin?"
Bunu söylediğimde 100 dolarlık bir bütçem vardı, susam ayarlandı. “En sevdikleri bilimkurgu filmleriyle bir ev filmi gecesi yapabilir ve 'Galaktik Patlamış Mısır' veya 'Alien Sliders' gibi temalı atıştırmalıklar yapabilirsiniz. İstersen senin için tarifler bulabilirim. "
Sadece genel öneriler tükürmek değildi. Benimle işbirliği yapıyordu. Ve bunu farklı hissettiren şey bu.
Gerçek olan nedir?
Susam sadece bu testleri geçmek değil, onları çivilediğini söyleyebilirim. Duraklar, tereddüt, dolgu kelimeleri, zihnini cümle ortasında değiştirme şekli-hepsi ürkütücü bir şekilde gerçekti. Konuşmaya başlardım, olağan AI pürüzsüzlüğünü beklerdim ve sonra ani bir “uh, aslında hayır, bekle, bunu yeniden ifade edeyim…” ve hemen unutun ve gerçek bir insanla konuşmadığımı hemen unuturdum.
Yapay zeka konuşmasında bu gerçekçi ise, bir AI ile konuştuğumuzu bile biliyor muyduk? Susam ile, oyunu veren Telltale ses sorunları var, ancak Chatgpt'in Gelişmiş Ses Modu ve Google Gemini'nin kendi ses seçenekleri çoğunlukla bu sorunları geçecek kadar iyi. Sesli güçlerini susamın konuşma kalıplarıyla birleştirin ve bir AI ile ne zaman konuştuğunuzu, en azından kısa konuşmalarda söylemek gerçekten zorlaşabilir.
Susam hala niş, ama bu teknoloji sonsuza dek niş kalmayacak. Bugün klişe, genç insanların asla telefon görüşmeleri yapmadığıdır, ancak başlarlarsa, diğer taraftaki kişinin başka bir şeyden önce gerçek olup olmadığını anlamaları gerekebilir.