वॉइस इंटरैक्शन के बारे में जानकारी

वॉइस इंटरैक्शन सर्विस एपीआई, आवाज़ से कंट्रोल करने वाले अलग-अलग ऐप्लिकेशन के लिए एक एब्स्ट्रैक्शन उपलब्ध कराता है. ऐप्लिकेशन डेवलपमेंट में बताए गए दिशा-निर्देशों का पालन करके, लागू करने की सुविधाएं बनाई जा सकती हैं. इस इंटिग्रेशन गाइड में दिए गए कॉन्टेंट में, इन ऐप्लिकेशन को किसी खास Android Automotive OS (AAOS) सिस्टम की इमेज में इंटिग्रेट करने का तरीका बताया गया है.

शब्दावली

इस गाइड में इन शब्दों का इस्तेमाल किया गया है:

  • असिस्ट डेटा. वॉइस इंटरैक्शन सेशन शुरू होने पर, सिस्टम व्यू और स्क्रीनशॉट कैप्चर कर सकता है. साथ ही, इस जानकारी को सेशन में भेज सकता है. ऐप्लिकेशन, Activity#onProvideAssistData() और Activity#onProvideAssistContent() को लागू करके ज़्यादा जानकारी दिखा सकते हैं.
  • पुश-टू-टॉक (पीटीटी). आवाज़ से कंट्रोल करने का फ़िज़िकल बटन, जो आम तौर पर स्टीयरिंग व्हील में होता है.
  • RecognitionService (RS). आवाज़ की पहचान करने वाली सेवा, जिसका इस्तेमाल ऐप्लिकेशन SpeechRecognizer API के ज़रिए करते हैं. वीआईए में VoiceInteractionService और RecognitionService, दोनों शामिल होने चाहिए.
  • टैप-टू-टॉक (टीटीटी). सॉफ़्टवेयर वॉइस कंट्रोल बटन, आम तौर पर इसे सिस्टम यूज़र इंटरफ़ेस (यूआई) में शामिल किया जाता है). Android में इसे असिस्ट क्लिक/इंप्रेशन भी कहा जाता है.
  • VoiceInteractionService. VIA डेवलपर की ओर से लागू की गई लाइटवाइट सिस्टम सेवा. चुनी गई सेवा, बूट पर सिस्टम सेवा से सीमित है और हमेशा काम करती रहती है.
  • VoiceInteractionSession (VIS). इस क्लास में, उपयोगकर्ता के इंटरैक्शन के कारोबारी नियम को इनकैप्सुलेट करता है. यह उपयोगकर्ता को वॉइस इंटरैक्शन की स्थिति दिखाने, VoiceInteractor के अनुरोधों को मैनेज करने, और सहायता और स्क्रीनशॉट का डेटा पाने के लिए ज़िम्मेदार है.
  • VoiceInteractionSessionService (VSS). यह एक ऐसी सेवा है जो VIA का हिस्सा है और इसकी मदद से वॉइस इंटरैक्शन सेशन को मैनेज किया जाता है. उपयोगकर्ता के साथ वॉइस इंटरैक्शन के दौरान, यह सेवा Android की सिस्टम सेवा से जुड़ी होती है. इस सेशन का सारा बिज़नेस लॉजिक, VoiceSession क्लास में लागू किया गया है. यह सेवा सिर्फ़ एक उपयोगकर्ता के वॉइस सेशन के दौरान चालू रहती है.
  • वॉइस इंटरैक्शन ऐप्लिकेशन (वीआईए). वॉइस कंट्रोल के तौर पर काम करने के लिए डिज़ाइन किया गया Android ऐप्लिकेशन (इसे असिस्टेंट कहा जाता है). इन ऐप्लिकेशन की पहचान, इनके मेनिफ़ेस्ट में VoiceInteractionService को शामिल करके की जा सकती है. सिस्टम में एक बार में, इनमें से सिर्फ़ एक ऐप्लिकेशन को डिफ़ॉल्ट के तौर पर चुना जा सकता है. सिर्फ़ डिफ़ॉल्ट ऐप्लिकेशन लाइव रहेगा (सिस्टम सेवा से जुड़ी होगी) और पुश-टू-टॉक (पीटीटी) या टैप-टू-टॉक (टीटीटी) इवेंट पाने वाला ऐप्लिकेशन होगा.

ज़िम्मेदारियां

इस टेबल में, हर पक्ष की ज़िम्मेदारी के बारे में बताया गया है.

कार बनाने वाली कंपनियां (ओईएम) AOSP ऐप्लिकेशन डेवलपर
  • AAOS की मदद से, सूचना और मनोरंजन की सुविधा देने वाला ऐसा डिवाइस बनाएं जो काम करता हो.
  • ऑडियो इनपुट और आउटपुट लागू करें. इसके अलावा, डीएसपी के लिए, बोले गए शब्द का पता लगाने की सुविधा भी शामिल की जा सकती है.
  • वॉइस इंटरैक्शन सेवाओं के लिए, सिस्टम के खास अधिकार दें.
  • ऐप्लिकेशन की सेटिंग स्क्रीन के ऐक्सेस से जुड़ी VoiceInteractionService ज़रूरी शर्तों को पूरा करें.
  • VoiceInteractionService और उससे जुड़े एपीआई तय करें और उन्हें बेहतर बनाएं.
  • VIA डेवलपर को एपीआई दस्तावेज़, सैंपल कोड, और मदद करने वाला अन्य कॉन्टेंट उपलब्ध कराएं.
  • उपयोगकर्ता अनुभव से जुड़ी ज़रूरी शर्तों और सुझावों के साथ-साथ, उसे इस्तेमाल करने से जुड़ी सलाह दें.
  • VoiceInteractionService एपीआई, RecognitionService एपीआई, और NotificationListenerService एपीआई लागू करें. ज़्यादा जानकारी के लिए, ऐप्लिकेशन डेवलपमेंट पर जाएं.
  • पसंद के मुताबिक बनाया जा सकने वाला यूज़र इंटरफ़ेस (यूआई) उपलब्ध कराएं, जिसे OEM, हर कार के डिज़ाइन सिस्टम के हिसाब से अडजस्ट कर सकें.

यूज़र एक्सपीरियंस से जुड़ी ज़रूरी शर्तें

ग्राहकों को अच्छा उपयोगकर्ता अनुभव देने की ज़िम्मेदारी, OEM की होती है. OEM को यह पक्का करना होगा कि पहले से इंस्टॉल की गई सभी वॉइस इंटरैक्शन सेवाएं, पहले से इंस्टॉल की गई Assistant: यूज़र एक्सपीरियंस से जुड़े दिशा-निर्देश में बताई गई ज़रूरी शर्तों को पूरा करती हों.

Assistant का मुख्य अनुभव

वाहन में बोलकर निर्देश देने की सुविधा देने वाला ऐप्लिकेशन (वीआईए), ये काम करता है:

  • [ज़रूरी है] सिस्टम से मैनेज किए जाने वाले वॉइस इंटरैक्शन ट्रिगर (पीटीटी, टीटीटी) का जवाब देना.
  • [ज़रूरी है] लोगों को उनकी प्रोग्रेस का विज़ुअल दिखाएं. उदाहरण के लिए, सुनना, प्रोसेस करना, और पूरा करना.
  • [ज़रूरी है] उपयोगकर्ता के अनुरोधों को समझने और उन्हें पूरा करने के बारे में बताने के लिए, बोलकर या आवाज़ों का इस्तेमाल करें.
  • [ज़रूरी है] अन्य ऐप्लिकेशन के लिए, बोली पहचानने की सुविधा का इस्तेमाल करें (SpeechRecognitionr एपीआई देखें).
  • [SHOULD] हॉटवर्ड ट्रिगर होने पर जवाब देना.
  • [MAY] सेटिंग गतिविधि दिखाएं, जहां उपयोगकर्ता इस वीआईए को कॉन्फ़िगर कर सकें. उदाहरण के लिए, अनुमतियां, हॉटवर्ड कॉन्फ़िगरेशन, और साइन इन.
  • [MAY] सहायता डेटा मैनेज करना (Intent#ACTION_ASSIST)
  • [MAY] कीगार्ड (लॉक स्क्रीन) से वॉइस इंटरैक्शन की सुविधा जोड़ी गई.

Components

वॉइस इंटरैक्शन ऐप्लिकेशन, इन एजेंट के साथ इंटरैक्ट करता है:

वॉइस इंटरैक्शन के लिए आवाज़ देने वाले आर्टिस्ट

पहली इमेज. वॉइस इंटरैक्शन के लिए आवाज़ देने वाले आर्टिस्ट

जानकारी:

  • VoiceInteractionManagerService. यह सिस्टम सेवा, डिफ़ॉल्ट VIA को मैनेज करने और बाकी सिस्टम के साथ इसकी सुविधाओं को शेयर करने के लिए ज़िम्मेदार है.
  • RecognitionService. यह सेवा बोली की पहचान करने की क्षमता को सिस्टम के दूसरे ऐप्लिकेशन में दिखाती है.
  • SoundTrigger. हॉटवर्ड मैनेजमेंट को लागू करता है. साथ ही, यह AlwaysOnHotwordDetector के ज़रिए VIA के लिए उपलब्ध है.
  • MediaRecorder. यह हॉटवर्ड का पता लगाने (सीपीयू का इस्तेमाल करते समय) और बोली की पहचान करने, दोनों के लिए ऑडियो इनपुट का ऐक्सेस देता है.
  • PhoneWindowManager/CarInputService. इन सेवाओं की ज़िम्मेदारी, मुख्य इवेंट को मैनेज करने के साथ-साथ VoiceInteractionManagerService की मदद से, पीटीटी को वीआईए पर भेजने की होती है.
  • User. उपयोगकर्ता, ट्रिगर (पीटीटी, टीटीटी, हॉटवर्ड) या वॉइस प्लेट यूज़र इंटरफ़ेस (यूआई) की मदद से, वीआईए से इंटरैक्ट करता है.
  • CarService, सूचनाएं, मीडिया, टेलीफ़ोन, ContactsProvider वगैरह. उपयोगकर्ता के निर्देशों को पूरा करने के लिए, VoiceInteractionSession की मदद से इस्तेमाल की जाने वाली सेवाएं और ऐप्लिकेशन.

ऑटोमोटिव से जुड़े सिद्धांत

AAOS, Android से इन मामलों में अलग है:

  • Assistant की सामान्य सुविधाओं के अलावा AAOS VIA, वाहन के फ़ंक्शन को कंट्रोल कर सकती हैं. जैसे, एचवीएसी, सीट, और घर के अंदर की लाइटें. इन सुविधाओं को CarPropertyManager API का इस्तेमाल करके इंटिग्रेट किया जा सकता है. ज़्यादा जानकारी के लिए, वाहन की प्रॉपर्टी पढ़ें पर जाएं. हालांकि, इसके लिए ज़रूरी है कि OEM, ऐक्सेस को सही तरीके से कॉन्फ़िगर करें. इस बारे में खास अनुमति की अनुमति वाली सूची में बताया गया है.
  • Automotive, डिवाइस, और अन्य डिवाइसों के नाप या आकार के मुकाबले, ज़्यादा काम का होता है. इन दिशा-निर्देशों को लागू करने के बारे में ज़्यादा जानने के लिए, पसंद के मुताबिक बनाने की सुविधा देखें.