لمحة عن التفاعل الصوتي

توفّر واجهة برمجة التطبيقات Voice Interaction Service API واجهة برمجة تطبيقات مجردة لمختلف تطبيقات التحكّم الصوتي المحتملة. يمكن تطوير عمليات التنفيذ باتّباع الإرشادات описанة في تطوير التطبيقات. يوضّح المحتوى في دليل الدمج هذا كيفية دمج هذه التطبيقات في صورة نظام Android Automotive (AAOS) معيّنة.

المصطلحات

يتم استخدام هذه المصطلحات في هذا الدليل:

  • بيانات المساهمة في الأهداف: عند بدء جلسة تفاعل صوتي، يمكن للنظام تسجيل المشاهدات ولقطات الشاشة ونقلها إلى الجلسة. يمكن للتطبيقات عرض معلومات إضافية من خلال تنفيذ Activity#onProvideAssistData() وActivity#onProvideAssistContent().
  • الضغط للتحدث (PTT): زر التحكّم الصوتي المادي، والذي يقع عادةً في عجلة القيادة
  • RecognitionService (RS) خدمة التعرّف على الصوت التي تستخدمها التطبيقات من خلال واجهة برمجة التطبيقات SpeechRecognizer يجب أن تتضمّن عناوين URL لصفحات المنتج في نتائج البحث عن طريق مقارنة الأسعار كلاً من VoiceInteractionService و RecognitionService.
  • النقر للتحدث (TTT): زر التحكّم الصوتي بالبرامج، والذي يكون عادةً مضمّنًا كجزء من واجهة مستخدم النظام في نظام التشغيل Android، يُشار إلى ذلك أيضًا باسم إيماءة المساعدة.
  • VoiceInteractionService: خدمة نظام خفيفة الوزن نفّذها مطوّر VIA. تكون الخدمة المحدّدة مرتبطة بخدمة النظام عند التشغيل، وتكون قيد التشغيل دائمًا.
  • VoiceInteractionSession (VIS) تُحاط هذه الفئة بمنطق النشاط التجاري للتفاعل مع المستخدم. وهي مسؤولة عن إطلاع المستخدم على حالة التفاعل الصوتي ومعالجة طلبات VoiceInteractor وتلقّي بيانات المساعدة ولقطات الشاشة.
  • VoiceInteractionSessionService (VSS) خدمة، وهي جزء من VIA، مسؤولة عن معالجة جلسة تفاعل صوتي. يتم ربط هذه الخدمة بخدمة نظام Android أثناء التفاعل الصوتي مع المستخدم. يتم تنفيذ كل منطق الأعمال لهذه الجلسة في فئة VoiceSession. لا يمكن ضمان استمرار هذه الخدمة إلا خلال جلسة صوتية واحدة للمستخدم.
  • تطبيق التفاعل الصوتي (VIA) تطبيق Android مصمّم ليكون بمثابة وحدة تحكّم صوتي (يُشار إليها باسم مساعد) يمكن تحديد هذه التطبيقات من خلال تضمين VoiceInteractionService في بيانها. يمكن اختيار تطبيق واحد فقط من هذه التطبيقات على أنّه تلقائي في كل مرة في النظام. سيتم إبقاء التطبيق التلقائي فقط قيد التشغيل (مرتبطًا بخدمة نظام) وسيكون هو المستلِم لأحداث Push-To-Talk (PTT) أو Tap-To-Talk (TTT).

المسؤوليات

يصف هذا الجدول مسؤوليات كل طرف.

الشركات المصنّعة للسيارات (OEM) مشروع مفتوح المصدر لنظام Android‏ (AOSP) مطوّرو التطبيقات
  • أنشئ نظام ترفيه ومعلومات متوافقًا باستخدام AAOS.
  • تنفيذ إدخال وإخراج الصوت، بما في ذلك اختياريًا معالجة الإشارات الرقمية (DSP) لرصد الكلمات المفتاح
  • منح أذونات امتيازات النظام لخدمات التفاعل الصوتي
  • الالتزام بمتطلبات VoiceInteractionService المتعلقة بالوصول إلى شاشات إعدادات التطبيق
  • تحديد VoiceInteractionService وتطوير واجهات برمجة التطبيقات ذات الصلة
  • تقديم مستندات واجهة برمجة التطبيقات ورمز نموذجي ومواد دعم أخرى لصنّاع تطبيقات VIA
  • تقديم إرشادات حول تجربة المستخدم مع المتطلبات والاقتراحات
  • تنفيذ واجهة برمجة التطبيقات VoiceInteractionService وواجهة برمجة التطبيقات RecognitionService و واجهة برمجة التطبيقات NotificationListenerService (اطّلِع على الوصف التفصيلي في تطوير التطبيقات).
  • توفير واجهة مستخدم قابلة للتخصيص يمكن لشركات المصنّعين الأصليّين للسيارات تعديلها لتتطابق مع كل نظام من أنظمة تصميم السيارات

متطلبات تجربة المستخدم

تتحمّل المصنّعين الأصليّين للأجهزة مسؤولية توفير تجربة مستخدم جيدة للعملاء. على المصنّعين الأصليين للأجهزة التأكّد من أنّ جميع خدمات التفاعل الصوتي المثبَّتة مسبقًا تستوفي المتطلبات الموضّحة في مساعِدِي الصوت المثبَّتين مسبقًا: إرشادات حول تجربة المستخدم.

تجربة "مساعد Google" الأساسية

ينفِّذ تطبيق التفاعل الصوتي (VIA) في المركبات الإجراءات التالية:

  • [يجب] الاستجابة لعوامل تشغيل التفاعل الصوتي التي يعالجها النظام (PTT وTTT).
  • [يجب] عرض تمثيل مرئي لمستوى التقدّم (على سبيل المثال، الاستماع والمعالجة والتنفيذ)
  • [يجب] استخدام الصوت أو الأصوات للإشارة إلى فهم طلبات العميل وإكمالها.
  • [يجب] أن يعمل كأداة تعرّف على الكلام للتطبيقات الأخرى (راجِع واجهة برمجة التطبيقات SpeechRecognizer).
  • [SHOULD] الاستجابة لعامل تشغيل كلمة مهمة
  • [يجوز] عرض نشاط إعدادات يمكن للمستخدمين من خلاله ضبط هذه الميزة من خلال واجهة برمجة التطبيقات (مثل الأذونات وإعداد الكلمات الرئيسية وتسجيل الدخول).
  • [MAY] بيانات المساعدة في التعامل مع الطلبات (Intent#ACTION_ASSIST)
  • [MAY] إتاحة التفاعل الصوتي من قفل الشاشة

المكوّنات

على مستوى عالٍ، يتفاعل تطبيق التفاعل الصوتي مع الجهات التالية:

الجهات الفاعلة في التفاعل الصوتي

الشكل 1: الجهات الفاعلة في التفاعل الصوتي

التفاصيل:

  • VoiceInteractionManagerService. تتحمّل خدمة النظام هذه مسؤولية إدارة واجهة برمجة التطبيقات التلقائية وعرض وظائفها على بقية النظام.
  • RecognitionService: توفّر هذه الخدمة قدرات التعرّف على الكلام للتطبيقات الأخرى في النظام.
  • SoundTrigger. تنفيذ إدارة الكلمات الرئيسية القصيرة، وهي متوفرة لتطبيقات VIA من خلال AlwaysOnHotwordDetector
  • MediaRecorder. يتيح الوصول إلى إدخال الصوت لكل من رصد الكلمات الرئيسية (عند استخدام وحدة المعالجة المركزية) والتعرّف على الكلام.
  • PhoneWindowManager/CarInputService: تتحمّل هذه الخدمات مسؤولية (من بين أمور أخرى) معالجة الأحداث الرئيسية وتوجيه PTT إلى VIA باستخدام VoiceInteractionManagerService.
  • User. يتفاعل المستخدم مع جهاز VIA من خلال عوامل التفعيل (PTT أو TTT أو عبارة التشغيل) أو واجهة مستخدم Voice Plate.
  • CarService وNotifications وMedia وTelephony وContactsProvider وما إلى ذلك الخدمات والتطبيقات التي تستخدمها VoiceInteractionSession ل تنفيذ طلبات المستخدم

مفاهيم خاصة بالسيارات

يختلف نظام التشغيل AAOS عن Android في الجوانب التالية:

  • بالإضافة إلى وظائف "مساعد Google" العادية، يمكن لتطبيقات VIA في AAOS التحكّم في وظائف المركبة (مثل التدفئة والتهوية وتكييف الهواء والمقاعد والأضواء الداخلية). يمكن دمج هذه الوظائف باستخدام واجهة برمجة التطبيقات CarPropertyManager API (اطّلِع على مزيد من المعلومات في مقالة قراءة خاصية المركبة) شرط أن تضبط المصنّعين الأصليّين للسيارات إذن الوصول بشكل صحيح كما هو موضّح في مقالة قائمة الأذونات المميّزة المسموح بها.
  • يُعدّ التخصيص واتساق التصميم أكثر ملاءمةً في الأجهزة المخصّصة للسيارات مقارنةً بأي شكل آخر للأجهزة. اطّلِع على التخصيص لقراءة المزيد من المعلومات عن تنفيذ هذه الإرشادات.