वॉइस इंटरैक्शन सर्विस एपीआई, आवाज़ से कंट्रोल करने वाले अलग-अलग ऐप्लिकेशन के लिए एक एब्स्ट्रैक्शन उपलब्ध कराता है. ऐप्लिकेशन डेवलपमेंट में बताए गए दिशा-निर्देशों का पालन करके, लागू करने की सुविधाएं बनाई जा सकती हैं. इस इंटिग्रेशन गाइड में दिए गए कॉन्टेंट में, इन ऐप्लिकेशन को किसी खास Android Automotive OS (AAOS) सिस्टम की इमेज में इंटिग्रेट करने का तरीका बताया गया है.
शब्दावली
इस गाइड में इन शब्दों का इस्तेमाल किया गया है:
- असिस्ट डेटा. वॉइस इंटरैक्शन सेशन शुरू होने पर, सिस्टम व्यू और स्क्रीनशॉट कैप्चर कर सकता है. साथ ही, इस जानकारी को सेशन में भेज सकता है. ऐप्लिकेशन,
Activity#onProvideAssistData()
औरActivity#onProvideAssistContent()
को लागू करके ज़्यादा जानकारी दिखा सकते हैं. - पुश-टू-टॉक (पीटीटी). आवाज़ से कंट्रोल करने का फ़िज़िकल बटन, जो आम तौर पर स्टीयरिंग व्हील में होता है.
- RecognitionService (RS). आवाज़ की पहचान करने वाली सेवा, जिसका इस्तेमाल ऐप्लिकेशन
SpeechRecognizer
API के ज़रिए करते हैं. वीआईए मेंVoiceInteractionService
औरRecognitionService
, दोनों शामिल होने चाहिए. - टैप-टू-टॉक (टीटीटी). सॉफ़्टवेयर वॉइस कंट्रोल बटन, आम तौर पर इसे सिस्टम यूज़र इंटरफ़ेस (यूआई) में शामिल किया जाता है). Android में इसे असिस्ट क्लिक/इंप्रेशन भी कहा जाता है.
VoiceInteractionService
. VIA डेवलपर की ओर से लागू की गई लाइटवाइट सिस्टम सेवा. चुनी गई सेवा, बूट पर सिस्टम सेवा से सीमित है और हमेशा काम करती रहती है.- VoiceInteractionSession (VIS). इस क्लास में, उपयोगकर्ता के इंटरैक्शन के कारोबारी नियम को इनकैप्सुलेट करता है. यह उपयोगकर्ता को वॉइस इंटरैक्शन की स्थिति दिखाने, VoiceInteractor के अनुरोधों को मैनेज करने, और सहायता और स्क्रीनशॉट का डेटा पाने के लिए ज़िम्मेदार है.
- VoiceInteractionSessionService (VSS). यह एक ऐसी सेवा है जो VIA का हिस्सा है और इसकी मदद से वॉइस इंटरैक्शन सेशन को मैनेज किया जाता है. उपयोगकर्ता के साथ वॉइस इंटरैक्शन के दौरान, यह सेवा Android की सिस्टम सेवा से जुड़ी होती है. इस सेशन का सारा बिज़नेस लॉजिक,
VoiceSession
क्लास में लागू किया गया है. यह सेवा सिर्फ़ एक उपयोगकर्ता के वॉइस सेशन के दौरान चालू रहती है. - वॉइस इंटरैक्शन ऐप्लिकेशन (वीआईए). वॉइस कंट्रोल के तौर पर काम करने के लिए डिज़ाइन किया गया Android ऐप्लिकेशन (इसे असिस्टेंट कहा जाता है). इन ऐप्लिकेशन की पहचान, इनके मेनिफ़ेस्ट में
VoiceInteractionService
को शामिल करके की जा सकती है. सिस्टम में एक बार में, इनमें से सिर्फ़ एक ऐप्लिकेशन को डिफ़ॉल्ट के तौर पर चुना जा सकता है. सिर्फ़ डिफ़ॉल्ट ऐप्लिकेशन लाइव रहेगा (सिस्टम सेवा से जुड़ी होगी) और पुश-टू-टॉक (पीटीटी) या टैप-टू-टॉक (टीटीटी) इवेंट पाने वाला ऐप्लिकेशन होगा.
ज़िम्मेदारियां
इस टेबल में, हर पक्ष की ज़िम्मेदारी के बारे में बताया गया है.
कार बनाने वाली कंपनियां (ओईएम) | AOSP | ऐप्लिकेशन डेवलपर |
---|---|---|
|
|
|
यूज़र एक्सपीरियंस से जुड़ी ज़रूरी शर्तें
ग्राहकों को अच्छा उपयोगकर्ता अनुभव देने की ज़िम्मेदारी, OEM की होती है. OEM को यह पक्का करना होगा कि पहले से इंस्टॉल की गई सभी वॉइस इंटरैक्शन सेवाएं, पहले से इंस्टॉल की गई Assistant: यूज़र एक्सपीरियंस से जुड़े दिशा-निर्देश में बताई गई ज़रूरी शर्तों को पूरा करती हों.
Assistant का मुख्य अनुभव
वाहन में बोलकर निर्देश देने की सुविधा देने वाला ऐप्लिकेशन (वीआईए), ये काम करता है:
- [ज़रूरी है] सिस्टम से मैनेज किए जाने वाले वॉइस इंटरैक्शन ट्रिगर (पीटीटी, टीटीटी) का जवाब देना.
- [ज़रूरी है] लोगों को उनकी प्रोग्रेस का विज़ुअल दिखाएं. उदाहरण के लिए, सुनना, प्रोसेस करना, और पूरा करना.
- [ज़रूरी है] उपयोगकर्ता के अनुरोधों को समझने और उन्हें पूरा करने के बारे में बताने के लिए, बोलकर या आवाज़ों का इस्तेमाल करें.
- [ज़रूरी है] अन्य ऐप्लिकेशन के लिए, बोली पहचानने की सुविधा का इस्तेमाल करें (SpeechRecognitionr एपीआई देखें).
- [SHOULD] हॉटवर्ड ट्रिगर होने पर जवाब देना.
- [MAY] सेटिंग गतिविधि दिखाएं, जहां उपयोगकर्ता इस वीआईए को कॉन्फ़िगर कर सकें. उदाहरण के लिए, अनुमतियां, हॉटवर्ड कॉन्फ़िगरेशन, और साइन इन.
- [MAY] सहायता डेटा मैनेज करना (
Intent#ACTION_ASSIST
) - [MAY] कीगार्ड (लॉक स्क्रीन) से वॉइस इंटरैक्शन की सुविधा जोड़ी गई.
Components
वॉइस इंटरैक्शन ऐप्लिकेशन, इन एजेंट के साथ इंटरैक्ट करता है:
पहली इमेज. वॉइस इंटरैक्शन के लिए आवाज़ देने वाले आर्टिस्ट
जानकारी:
VoiceInteractionManagerService
. यह सिस्टम सेवा, डिफ़ॉल्ट VIA को मैनेज करने और बाकी सिस्टम के साथ इसकी सुविधाओं को शेयर करने के लिए ज़िम्मेदार है.RecognitionService
. यह सेवा बोली की पहचान करने की क्षमता को सिस्टम के दूसरे ऐप्लिकेशन में दिखाती है.SoundTrigger
. हॉटवर्ड मैनेजमेंट को लागू करता है. साथ ही, यह AlwaysOnHotwordDetector के ज़रिए VIA के लिए उपलब्ध है.MediaRecorder
. यह हॉटवर्ड का पता लगाने (सीपीयू का इस्तेमाल करते समय) और बोली की पहचान करने, दोनों के लिए ऑडियो इनपुट का ऐक्सेस देता है.PhoneWindowManager
/CarInputService
. इन सेवाओं की ज़िम्मेदारी, मुख्य इवेंट को मैनेज करने के साथ-साथVoiceInteractionManagerService
की मदद से, पीटीटी को वीआईए पर भेजने की होती है.User
. उपयोगकर्ता, ट्रिगर (पीटीटी, टीटीटी, हॉटवर्ड) या वॉइस प्लेट यूज़र इंटरफ़ेस (यूआई) की मदद से, वीआईए से इंटरैक्ट करता है.- CarService, सूचनाएं, मीडिया, टेलीफ़ोन, ContactsProvider वगैरह. उपयोगकर्ता के निर्देशों को पूरा करने के लिए, VoiceInteractionSession की मदद से इस्तेमाल की जाने वाली सेवाएं और ऐप्लिकेशन.
ऑटोमोटिव से जुड़े सिद्धांत
AAOS, Android से इन मामलों में अलग है:
- Assistant की सामान्य सुविधाओं के अलावा AAOS VIA, वाहन के फ़ंक्शन को कंट्रोल कर सकती हैं. जैसे, एचवीएसी, सीट, और घर के अंदर की लाइटें. इन सुविधाओं को CarPropertyManager API का इस्तेमाल करके इंटिग्रेट किया जा सकता है. ज़्यादा जानकारी के लिए, वाहन की प्रॉपर्टी पढ़ें पर जाएं. हालांकि, इसके लिए ज़रूरी है कि OEM, ऐक्सेस को सही तरीके से कॉन्फ़िगर करें. इस बारे में खास अनुमति की अनुमति वाली सूची में बताया गया है.
- Automotive, डिवाइस, और अन्य डिवाइसों के नाप या आकार के मुकाबले, ज़्यादा काम का होता है. इन दिशा-निर्देशों को लागू करने के बारे में ज़्यादा जानने के लिए, पसंद के मुताबिक बनाने की सुविधा देखें.