بقلم : د. جاسم حاجي
الذكاء الاصطناعي الصوتي هو أداة للمحادثة تستخدم الذكاء الاصطناعي لتلقي التوجيهات وتفسير الأوامر الصوتية . باستخدام هذه التقنية ، يمكن للأجهزة التفاعل والرد على الأسئلة البشرية صوتيًا. مع القدرة على فهم لغة الإنسان والتواصل معهم ، أتاح روبوت الدردشة الصوتي المزود بالذكاء الاصطناعي فرصة كبيرة للشركات لخدمة العملاء.
يساعد على تسريع العمليات وزيادة الإنتاجية وتوسيع نطاق العمليات.
ما يقرب من 55 ٪ من مستخدمي المساعد الافتراضي يفضلون تطبيقات التعرف على الكلام لأنها توفر تشغيل الأجهزة بدون استخدام اليدين. مع التوجه الحالي ، يمكن أن تبلغ قيمة سوق مكبرات الصوت التي تعمل بالأوامر الصوتية 30 مليار دولار بحلول عام 2024.
إن محللي الأوامر الصوتية بالذكاء الاصطناعي، وهم Amazon Echo و Siri و Google Assistant و Google Home و Amazon Alexa وغيرهم ، هم عدد قليل من التطورات المذهلة التي لديها استبدال الحاجة إلى أجهزة تعمل باللمس.
يتوقع الخبراء أن يصل التسوق باستخدام تقنيات التحليل الصوتي إلى 40 مليار دولار في عام 2022.
العمل الأساسي لهذه التقنية يعتمد الذكاء الاصطناعي لفهم اللغة البشرية وتفسيرها لتقديم النتائج المناسبة. تعمل برمجة الذكاء الاصطناعي على إتقان خوارزمياتها لتقديم أفضل إجابة منطقية باستمرار. يساعد مزيج من الذكاء الاصطناعي والأتمتة في تطوير أنظمة الكلام. كما هو الحال عندما يتواصل شخصان ، يتم تشفير الرسالة وفك تشفيرها ؛يعمل الذكاء الاصطناعي الصوتي بشكل مشابه.
أدناه ، نناقش الخطوات المتبعة في التعرف على الكلام في الذكاء الاصطناعي.
1. تحليل الكلام وترجمته إلى نص هي الخطوة الأولى في عملية فهم أوامر المتحدث. تحتاج الموجات الصوتية التي يولدها المتحدث إلى تفسيرها وتحليلها لتقسيمها إلى أجزاء من النص. تستخدم الشركات تقنية التعرف على الكلام لهذه الخطوة. يتم تقسيم كلمات المستخدم إلى مجموعات بواسطة الذكاء الاصطناعي. في هذه العملية ، يتم تحويل الكلمات إلى أجزاء يسهل على النظام فهمها.
2. تصفية الأصوات المحيطة ، هناك فرص أنه بالإضافة إلى الكلمات التي يتحدث بها المستخدم ، يتم التقاط بعض الأصوات المحيطة بواسطة الذكاء الاصطناعي. أن الاتصال بمركز اتصال أثناء السير على الطريق يمكن أن يزيد من فرص تسجيل الاضطرابات المحيطة مثل الأبواق أو الإعلانات التي تحدث في الرسالة.
3. التحويل إلى المعالجة العصبية ، يعتمد الذكاء الاصطناعي الصوتي على الشبكات العصبية التي تقوم بتكرار الخلايا العصبية في دماغ الإنسان. يتم تقسيم مجموعة البيانات التي تصل إلى النظام بشكل أكبر للعثور على أفضل تطابق.
4. التقنيات النحوية والدلالية، أصبح الذكاء الاصطناعي الصوتي قادرًا على استخدام التقنيات النحوية والدلالية لتحليل النص ، حيث يمكنه فهم الأوامر الصوتية بدقة.
5. تقييم الاستجابة، يصل الذكاء الاصطناعي إلى مجموعة محددة من الاستنتاجات من خلال فحص سؤال المستخدم بعناية. تقوم الخوارزمية أيضًا بتحليل الحلول الأكثر احتمالًا وتصفية الردود للعثور على التطابق المثالي للاستعلام.
6. التواصل مع المستخدم بالصوت في الخطوة الأخيرة ، بذلك يتم إرسال الاستجابة المحددة إلى المستخدم. هنا يتلقى المستخدم الرد على الاستعلام بينما يقوم الذكاء الاصطناعي في نفس الوقت بتحويل البيانات بتنسيق صوتي.
يحفظ الذكاء الاصطناعي أيضًا الاستجابة للرجوع إليها في المستقبل.