كيف تتمكن البكسلات من التمييز بين عدة أشخاص في التسجيل الصوتي

جوجل تكشف أسرار تطبيقها للتسجيل الصوتي. إنه أكثر من مجرد تطبيق مثبت مسبقًا، فهو يسمح لك بإجراء النسخ المكتوب وحتى التمييز بين المتحدثين. إنجاز تكنولوجي مدمج في هواتف Pixel الذكية أوضحته Google.

تطبيق تسجيل الصوت على البيكسلات // المصدر: Google

جوجليشرح كيف تمكن من التمييز بين المتحدثين في المناقشة عن طريق عزل المسارات الصوتية وفي النسخ المكتوب. الوظائف المتاحة على بعضالهواتف الذكيةبكسل في تطبيق Pixel Recorder.

تطبيق Pixel Recorder من Google مذهل

التجربة بكسلاكتمل. وحتى عندما تعتقد أنك قد قمت بتغطية كل شيء، لا تزال هناك بعض الوظائف الصغيرة المفيدة جدًا والتي تعد، قبل كل شيء، حصرية لهواتف Google الذكية. قبل أيام قليلة،بكسل 6,بكسل 6 برو,بكسل 6 أ,بكسل 7وآخرونبكسل 7 بروتلقى أتحديث نظامهم. إنه يعزز تطبيق تسجيل الصوت Pixel Recorder.

عرض توضيحي للنسخ المكتوب في Pixel Recorder بدون تسمية السماعة ومعها // المصدر: Google

يتمكن الأخير من تحديد وتسمية كل متحدث في التسجيلات الصوتية وفي النسخ المكتوب (عن طريق تخطي الأسطر). يعمل بواسطةالتعلم الآليومن الواضح أنه يمكننا تنقيح النصوص بعد ذلك، ولكن أيضًا تعيين أسماء لهذه التسميات.

كيف يمكن لـ Google التعرف على عدة متحدثين في المحادثة

في أتذكرة أنهم بلوقيشرح مهندسو Google كيف تتمكن هذه الميزة من نسخ الصوت عن طريق التمييز بين الأشخاص الذين يتحدثون. المسؤول الرئيسي عن هذا النسخ الذكي هو نظام وضع علامات على المتحدثين الجديد الذي طورته Google، والذي يسمىتحويل إلى يوميات، يعرض لأول مرة هذا العام.

يجب أن يتعامل هذا النظام مع الأداء المحدود لجهاز محمول: "يستفيد من العديد من نماذج وخوارزميات التعلم الآلي المحسنة للغاية» للعمل في الوقت الحقيقي. وتتكون من ثلاثة عناصر:

  • نموذج الكشف عن تغيير المتكلم؛
  • نموذج ترميز المتحدث الذي يستخرج الميزات الصوتية من كل كلام المتحدث؛
  • خوارزمية تجميعية متعددة المراحل تقوم بتعليق تسميات المتحدثين لكل خطاب.
تطبيق Pixel Recorder // المصدر : Google

كلما زاد طول التسجيل الصوتي، أصبح التعلم الآلي أكثر موثوقية، لأنه يكتسب البيانات بمرور الوقت. يمكننا بعد ذلك تسجيل عدة ساعات دون أي مشكلة (حتى 18 ساعة)، وهذا أفضل. علاوة على ذلك، يمكن لنظام التصنيف هذا أحيانًا تصحيح تسميات المتحدث التي قدمها سابقًا في التسجيل، إذا أدرك أنه ارتكب خطأ.

في الوقت الراهن،تحويل إلى يومياتيعمل على جزء وحدة المعالجة المركزية منجوجل موتر يضغط، لكن مهندسيها يأملون في تفويض المزيد من العمليات الحسابية إلى كتلة TPU المخصصة لاستخداماتالذكاء الاصطناعيوالذي يشكل جزئيًا المحرك العصبي للرقائق. وهذا من شأنه تحسين كفاءة الطاقة.


هل ترغب في الانضمام إلى مجتمع من المتحمسين؟خلافنايرحب بكم، إنه مكان للمساعدة المتبادلة والشغف بالتكنولوجيا.