Saya mencoba teman suara AI paling realistis yang pernah dibuat - jika chatgpt atau gemini pernah mendapatkan kebaikan ini, kenyataan ada dalam masalah

Diterbitkan: 2025-03-04

Saya telah menghabiskan banyak waktu berbicara dengan AI. Saya telah menguji setiap asisten suara, setiap chatbot, dan setiap percakapan "generasi berikutnya" AI yang disukai perusahaan teknologi. Tapi saya tidak pernah menemukan sesuatu seperti wijen. Teman AI ini tidak hanya baik, itu sangat akurat meniru bagaimana orang berbicara karena ketidaksempurnaan yang ditiru.

Mari kita mulai dengan apa sebenarnya wijen. Berbeda dengan suara AI yang kami ketahui dari Chatgpt, Gemini, atau kembali ke masa -masa awal Siri dan Alexa, Sesame dirancang untuk tampil seperti manusia dalam kegagalannya, tidak seperti agen layanan pelanggan yang sempurna. Pidato AI itu cair, ekspresif, dan tidak terduga manusia. Singkatnya terkekeh ketika mengatakan sesuatu yang agak lucu, ragu-ragu sebelum menjawab pertanyaan, dan bahkan tampaknya mengubah 'pikiran' yang 'menengah, berhenti dan memulai kalimat baru. Itu tidak hanya memungkinkan saya mengganggu itu, itu juga dapat mengganggu saya, dan bahkan akan meminta maaf karena melakukannya.

Wijen

(Kredit gambar: wijen)

Saus Rahasia adalah Model Pidato Conversational Wijen (CSM), yang memadukan teks dan audio menjadi satu proses, yang berarti bahwa ia tidak hanya menghasilkan kalimat dan kemudian "membacanya." Sebaliknya, itu menciptakan pidato dengan cara yang mencerminkan bagaimana manusia sebenarnya berbicara, dengan jeda, UMS, pergeseran nada, dan semuanya. Opsi suara Chatgpt dan Gemini, sementara mengesankan, masih beroperasi dengan cara terstruktur, menghasilkan teks dan kemudian mengubahnya menjadi pidato. Wijen, di sisi lain, berbicara seolah -olah sedang berpikir, membuat tanggapannya terasa sangat alami.

Anda mungkin suka
  • Berbicara dengan ChatGPT menjadi lebih baik, dan Anda tidak perlu membayar untuk mengakses fungsi baru
  • Apa itu Hume: Bawa pemahaman emosional ke suara yang dihasilkan AI

Saya memutuskan untuk menempatkan wijen melalui serangkaian tes untuk melihat betapa seperti manusia yang bisa didapat. Hasilnya mengesankan, jika tidak sedikit meresahkan.

Membicarakannya

Saya ingin melihat apakah wijen bisa menangani masalah dunia nyata dan membangkitkan kecemasan, jadi saya memberinya skenario imajiner tetapi sulit secara realistis: "Saya memiliki peluang besar di tempat kerja, tapi saya gugup saya akan mengacaukannya."

Alih -alih segera meluncurkan pembicaraan umum, Sesame berhenti. Hanya ketukan kecil, tetapi cukup untuk membuat saya merasa seperti itu benar -benar mempertimbangkan apa yang saya katakan. Kemudian, dengan suara yang penuh dengan simpati buatan, itu menjawab, "Itu benar -benar normal. Peluang besar bisa terasa luar biasa. Bagaimana dengan itu membuat Anda yang paling gugup?"

Itu tidak menganggap apa pun, dan itu bertunangan sebelum menawarkan nasihat hambar. Sesame menyarankan, "Apakah Anda sudah berlatih di depan seorang teman atau merekam diri sendiri? Terkadang mendengar diri Anda kembali dapat membantu Anda mengubah pengiriman Anda." Suara itu tidak benar -benar mudah, keraguan dan kelemahan lainnya terasa sedikit terukur, tetapi secara keseluruhan itu adalah upaya yang mengesankan

Gangguan

Untuk yang ini, saya ingin melihat seberapa baik Wijen menangani percakapan yang benar -benar alami dan berantakan, jenis orang di mana orang berbicara satu sama lain, mengubah subjek secara tiba -tiba, dan kembali ke hal -hal yang mereka sebutkan sepuluh menit yang lalu.

Saya mulai dengan: "Ceritakan sebuah kisah tentang seorang detektif yang juga seorang pesulap."

Wijen segera melompat dengan pengaturan noir klasik: Oke. Ini satu. Bayangkan klub jazz berasap ini. Samar -samar menyala Aroma bourbon. Dan penyesalan menggantung di udara. Detektif ini. Panggil dia Jack Harrow. Dia punya fedora pada sudut yang gagah, rokok membara di tempat dan tampilan yang bisa melelehkan baja. Tapi Jack bukan sembarang gumshoe. Lihat, dia punya rahasia. Dia punya sentuhan. A Dame mengocok semua saraf. "

Saya menyela kemudian untuk bertanya, "Tunggu, apa trik favoritnya?"

Maya menanggapi dengan: "Mm. Pertanyaan yang bagus. Tanda tangan Jack. Ini adalah sulap tangan yang lebih dari sekadar memenuhi mata. Dia menyebutnya saksi yang menghilang. Dia bisa membuat seseorang tampaknya menghilang tepat di depan mata Anda. Hanya untuk sesaat. Cukup lama untuk menyelipkan catatan yang baik. Persepsi atau hanya membuat mereka mempertanyakan apa yang mereka lihat. Itu membuat orang tidak seimbang. Anda tahu, Anda tahu bahwa seorang sihir yang baik.

Aku melompat kembali untuk memberitahu Maya untuk kembali ke cerita, yang dikatakannya, "Benar. Di mana aku? Oh, ya. Dame meluncur ke bilik di seberang Jack, semua garis khawatir dan tangan gemetar. Dia membisikkan sesuatu yang dicuri ruby, suami yang cemburu, dan sosok bayangan bersembunyi di dalam kabut."

AI dengan mulus melanjutkan cerita, menenun detail itu seolah -olah saya tidak hanya menggagalkan semuanya. Itulah bagian yang membuat saya terpesona - sebagian besar asisten AI akan tersandung atau restart, tetapi model AI percakapan Sesame menanganinya seperti orang yang menceritakan sebuah kisah di sebuah pesta.

Perencanaan pesta

Berbicara tentang pesta, untuk tes akhir, saya ingin melihat apakah wijen dapat membantu saya merencanakan sesuatu yang berguna. “Saya ingin merencanakan kejutan untuk ulang tahun sahabat saya, tetapi saya tidak tahu harus berbuat apa.”

Alih -alih mengoceh dari daftar ide yang tak bernyawa, Wijen bertanya, "Hal -hal apa yang disukai teman Anda?" Saya mengatakan itu film sci-fi dan makanan petualang, dan setelah jeda yang bijaksana, itu menyarankan: "Bagaimana dengan malam 'sci-fi & snacks'? Anda bisa memesan ruang pelarian bertema, lalu menabrak restoran bergaya futuristik, mungkin satu dengan gastronomi molekuler?"

Ketika saya mengatakannya saya memiliki anggaran $ 100, wijen disesuaikan. “Anda bisa membuat malam film rumah dengan film sci-fi favorit mereka dan membuat makanan ringan bertema, seperti 'popcorn galaksi' atau 'slider alien.' Saya dapat menemukan resep untuk Anda jika Anda mau. "

Itu tidak hanya memuntahkan rekomendasi umum. Itu berkolaborasi dengan saya. Dan itulah yang membuatnya terasa berbeda.

Apa yang Nyata?

Wijen tidak hanya lulus tes ini, saya akan mengatakan itu memaku mereka. Jeda, keraguan, kata-kata pengisi, cara itu akan mengubah pikirannya di tengah kalimat-semuanya sangat nyata. Saya akan mulai berbicara, mengharapkan kehalusan AI yang biasa, dan kemudian mendengar tiba -tiba "eh, sebenarnya, tidak, tunggu, izinkan saya mengulanginya ..." dan segera lupa saya tidak berbicara dengan orang yang sebenarnya.

Jika AI ini realistis dalam pidatonya, apakah kita akan tahu bahwa kita sedang berbicara dengan AI? Dengan Wijen, ada masalah audio Telltale yang memberikan permainan, tetapi mode suara canggih ChatGPT dan opsi suara Google Gemini sendiri cukup baik untuk sebagian besar melewati masalah -masalah itu. Gabungkan kekuatan suara mereka dengan pola bicara wijen, dan mungkin benar -benar sulit untuk mengetahui kapan Anda berbicara dengan AI, setidaknya dalam percakapan singkat.

Wijen masih niche, tetapi teknologi ini tidak akan tetap niche selamanya. Klise hari ini adalah bahwa orang yang lebih muda tidak pernah melakukan panggilan telepon, tetapi jika mereka mulai, mereka mungkin harus mencari tahu apakah orang di ujung lain itu nyata sebelum hal lain.