أصبح المساعدون الشخصيون الذين يدعمون الصوت الآن جزءًا استراتيجيًا من أنظمة الأجهزة المحمولة، مع Siri لنظام iOS، وGoogle Now لنظام Android، وCortana لنظام التشغيل Windows. تم إجراء دراسة بعدة لغات باستخدام بروتوكول اختبار بسيط إلى حد ما يسمح بتقييم أداء المساعدين الصوتيين.
في تقنيات الكلام هذه، نجد تقنيتين: ASR (التعرف التلقائي على الكلام) للتعرف على الكلام وTTS (تحويل النص إلى كلام) لتجميع الكلام. تعتبر هاتان التقنيتان ضروريتين للتواصل بين الإنسان والآلة، وهما معقدتان: يجب أن تتعرفا على أي صوت في ظروف صوتية متغيرة وصاخبة في كثير من الأحيان، وبالطبع خصوصيات كل لغة مع الفروق الدقيقة في المفردات وأطوال الكلمات المختلفة. نعم، اللغة الطبيعية ليس لديها قواعد نحوية صارمة لا لبس فيها، والسياق والتجويد يعطي معنى لجملنا.
أجرت شركة الإعلام VentureBeat اختبارًا بسيطًا إلى حد ما: 18 سؤالًا بخمس لغات مختلفة: الإنجليزية والإيطالية والفرنسية والألمانية والماندرين. في اللغة الإنجليزية النتائج جيدة مع المساعدين الثلاثة. في الفرنسية واللغات الأخرى، يتفوق Siri بشكل واضح على Google Now وCortana.
أما بالنسبة للغة الماندارين، فلا يزال لدى جوجل الكثير من العمل الذي يتعين عليها القيام به لتحسين التعرف على الصوت. للتذكير، تقدم Google أكثر من 50 لغة ولهجة، وهو ما يفوق بكثير كلاً من Siri وCortana.
نراكم كل يوم أربعاء على Twitch، من الساعة 5 مساءً حتى الساعة 7 مساءً، للمتابعة المباشرةالعرض Survoltésمن إنتاج فراندرويد. سيارة كهربائية، دراجة كهربائية، نصيحة الخبراء، ألعاب أو شهادات، هناك شيء للجميع!