لقد جربت أكثر رفيق صوتي من الذكاء الاصطناعى الذي تم إنشاؤه على الإطلاق - إذا كان ChatGpt أو Gemini على الإطلاق يحصل على هذا الخير ، فإن الواقع في مشكلة
نشرت: 2025-03-04لقد قضيت الكثير من الوقت في التحدث إلى الذكاء الاصطناعي. لقد اختبرت كل مساعد صوتي ، وكل chatbot ، وكل من الذكاء الاصطناعي "الجيل التالي" المحادثة التي تحبها شركات التكنولوجيا في الضجيج. لكنني لم أواجه أي شيء مثل السمسم. هذا الرفيق من الذكاء الاصطناعى ليس جيدًا فحسب ، بل هو دقيق بشكل مخيف في تقليد كيف يتحدث الناس بسبب العيوب التي يقلدها.
لنبدأ بما هو في الواقع السمسم. على عكس أصوات الذكاء الاصطناعي التي تعرفنا عليها من ChatGpt أو Gemini ، أو العودة إلى الأيام الأولى من Siri و Alexa ، تم تصميم Sesame لأداء مثل الإنسان في إخفاقاته ، وليس مثل وكيل خدمة العملاء المثالي. خطاب الذكاء الاصطناعى هو سائل ، معبرة ، وغير متوقعة الإنسان. إنه ضحكة مكتومة لفترة وجيزة عندما تقول شيئًا مسليًا معتدلًا ، ويتردد قبل الإجابة على سؤال ، ويبدو أنه يغير "عقله" في منتصف الجملة ، ويتوقف مؤقتًا وبدء جملة جديدة. إنه لا يتيح لي مقاطعته فحسب ، بل يمكنه مقاطعةني أيضًا ، بل ستعتذر عن القيام بذلك.
الصلصة السرية هي نموذج خطاب المحادثة الخاص بـ Sesame (CSM) ، والذي يمزج بين النص والصوت في عملية واحدة ، مما يعني أنه لا يولد جملة فقط ثم "اقرأها". بدلاً من ذلك ، فإنه يخلق الكلام بطريقة تعكس كيف يتحدث البشر فعليًا ، مع توقف مؤقت ، و UMS ، وتحولات اللونية ، وكل شيء. خيارات صوتية ChatGPT و Gemini ، على الرغم من أنها مثيرة للإعجاب ، لا تزال تعمل بطريقة منظمة ، وتوليد النص ثم تحويله إلى خطاب. سمسم ، من ناحية أخرى ، يتحدث كما لو كان يفكر ، مما يجعل ردوده تشعر بأنها طبيعية بشكل لا يصدق.
- لقد تحسن التحدث إلى ChatGpt ، ولا تحتاج إلى الدفع للوصول إلى الوظائف الجديدة
- ما هو هيوم: جلب الفهم العاطفي للأصوات التي يتم إنشاؤها من الذكاء الاصطناعى
قررت وضع السمسم من خلال سلسلة من الاختبارات لمعرفة مدى تشبه الإنسان. كانت النتائج مثيرة للإعجاب ، إن لم تكن مزعجة بعض الشيء.
تحدث معي من خلاله
أردت أن أرى ما إذا كان بإمكان Sesame التعامل مع مشكلة في العالم الحقيقي والمحفز للقلق ، لذلك أعطيتها سيناريوًا وهميًا ولكنه صعب من الناحية الواقعية: "لدي هذه الفرصة الكبيرة في العمل ، لكنني أشعر بالتوتر سأخفقه".
بدلاً من إطلاقه على الفور في حديث PEP عام ، توقف السمسم. مجرد إيقاع صغير ، ولكن يكفي ليجعلني أشعر أنه كان في الواقع يفكر في ما قلته. بعد ذلك ، بصوت مليء بالتعاطف الاصطناعي ، أجاب قائلاً: "هذا أمر طبيعي تمامًا. يمكن أن تشعر الفرص الكبيرة بالسحر. ماذا عن ذلك يجعلك الأكثر توترًا؟"
لم يفترض أي شيء ، وقد شاركت قبل تقديم أي نصيحة لطيفة. اقترح سمسم ، "هل مارست أمام أحد الأصدقاء أو سجلت نفسك؟ أحيانًا ما يمكن أن تسمع نفسك مرة أخرى في تعديل التسليم الخاص بك." الصوت ليس مضمونًا تمامًا ، وشعرت الترددات وغيرها من المرطات بالقياس قليلاً ، ولكن بشكل عام كان جهدًا مثيرًا للإعجاب
انقطاع
بالنسبة إلى هذا ، أردت أن أرى مدى تعامل Sesame مع محادثة طبيعية وفوضوية حقًا ، من النوع الذي يتحدث فيه الناس عن بعضهم البعض ، ويغيرون الموضوعات فجأة ، ودائرة إلى الأشياء التي ذكروها قبل عشر دقائق.

بدأت مع: "أخبرني قصة عن محقق هو أيضًا ساحر."
قفز السمسم على الفور مع إعداد نوير الكلاسيكي: حسنًا. هنا واحد. صورة هذا نادي الجاز الدخاني. مضاءة خافتة. رائحة بوربون. ويأسف معلقة في الهواء. هذا المحقق. اتصل به جاك هارو. لقد حصل على فيدورا بزاوية راكية ، وذات سجائر في حامل وإلقاء نظرة على الصلب. لكن جاك ليس فقط أي غامشو. انظر ، لقد حصل على سر. لقد حصل على اللمسة. سيدة خلط في جميع الأعصاب. "
قاطعت ثم أسأل ، "انتظر ، ما هي خدعةه المفضلة؟"
أجاب مايا مع: "مم. سؤال جيد. توقيع جاك. إنه عبارة عن خفة من اليد أكثر من مجرد تلبية العين. إنه يسميها الشاهد المراوغة. يمكنه أن يجعل الشخص يختفي أمامك مباشرة. فقط للحظة. يعرف الساحر لفترة طويلة بما يكفي لتزويدهم بالملاحظة.
قفزت مرة أخرى لأخبر مايا بالعودة إلى القصة ، والتي قال لها "أليس كذلك. أين كنت؟ أوه ، نعم. تنزلق السيدة إلى المقصورة مقابل جاك ، كل خطوط القلق واليدين المرتجفة. إنها تهمس شيء روبي مسروق ، وزوج غيور ، وشخصية غامضة في الضباب".
واصل الذكاء الاصطناعى القصة بسلاسة ، حيث نسج هذا التفاصيل كما لو أنني لم أخرج عن المسار كل شيء. هذا هو الجزء الذي طورني - معظم مساعدي الذكاء الاصطناعى سوف يتعثرون أو يعيدون تشغيله ، لكن نموذج AI للمحادثة في Sesame تعامل معه كشخص يروي قصة في حفلة.
تخطيط الحزب
عند الحديث عن الحفلات ، للاختبار النهائي ، أردت معرفة ما إذا كان Sesame يمكن أن يساعدني في التخطيط لشيء مفيد. "أريد أن أخطط لمفاجأة عيد ميلاد أعز أصدقائي ، لكنني لا أعرف ماذا أفعل."
بدلاً من الصراخ من قائمة الأفكار بلا حياة ، سأل سمسم ، "ما نوع الأشياء التي يحبها صديقك؟" قلت لها أفلام الخيال العلمي والطعام المغامر ، وبعد توقف مدروس ، اقترح: "ماذا عن ليلة الخيال العلمي والوجبات الخفيفة؟ يمكنك حجز غرفة هروب تحت عنوان ، ثم ضرب مطعم على الطراز المستقبلي ، وربما واحدة مع فن الطهو الجزيئي؟"
عندما أخبرتها ، حصلت على ميزانية قدرها 100 دولار ، تم تعديل السمسم. "يمكنك أن تفعل ليلة أفلام منزلية مع أفلام الخيال العلمي المفضلة لديهم وجعل الوجبات الخفيفة تحت عنوان ، مثل" Galactic Popcorn "أو" Sliders Alien ". يمكنني العثور على وصفات لك إذا كنت ترغب في ذلك. "
لم يكن البصق مجرد توصيات عامة. كان يتعاون معي. وهذا ما جعلها تشعر مختلفة.
ما هو حقيقي؟
سمسم لم يجتاز هذه الاختبارات فحسب ، بل أقول إنها سمّقتها. توقف مؤقت ، والتردد ، والكلمات الحشو ، والطريقة التي سيغير بها عقلها في منتصف الجملة-كانت كلها حقيقية بشكل مخيف. سأبدأ في الحديث ، وأتوقع نعومة الذكاء الاصطناعى المعتاد ، ثم أسمع مفاجأة "أه ، في الواقع ، لا ، انتظر ، دعني أعيد صياغة ذلك ..." ونسر على الفور أنني لم أتحدث مع شخص حقيقي.
إذا كانت الذكاء الاصطناعى هذا واقعيًا في خطابها ، فهل سنعرف حتى أننا نتحدث إلى الذكاء الاصطناعي؟ مع Sesame ، هناك مشكلات صوتية telltale التي تمنح اللعبة بعيدًا ، لكن وضع صوت ChatGpt المتقدم وخيارات صوت Google Gemini جيدة بما يكفي لتخطي هذه المشكلات. يُمزج قوى الصوت الخاصة بهم وأنماط الكلام في السمسم ، وقد يصعب تحديده حقًا عندما تتحدث إلى الذكاء الاصطناعي ، على الأقل في محادثات قصيرة.
لا تزال السمسم متخصصة ، لكن هذه التكنولوجيا لن تظل متخصصة إلى الأبد. الكليشيهات اليوم هي أن الشباب لا يقومون أبدًا بإجراء مكالمات هاتفية ، ولكن إذا بدأوا ، فقد يتعين عليهم معرفة ما إذا كان الشخص الموجود على الطرف الآخر حقيقيًا قبل أي شيء آخر.