با شروع از اندروید 11، NNAPI کیفیت خدمات (QoS) بهتری را با اجازه دادن به برنامه برای نشان دادن اولویت های نسبی مدل های خود، حداکثر زمان مورد انتظار برای آماده شدن یک مدل معین و حداکثر زمان مورد انتظار برای ارائه می دهد. یک اجرای معین باید تکمیل شود. علاوه بر این، Android 11 مقادیر اضافی خطای NNAPI را معرفی میکند که به یک سرویس امکان میدهد با دقت بیشتری نشان دهد که در صورت بروز نقص چه اشتباهی رخ داده است تا برنامه مشتری بتواند بهتر واکنش نشان دهد و بازیابی کند.
اولویت
برای Android 11 یا بالاتر، مدلها با اولویت در NN HAL 1.3 آماده شدهاند. این اولویت نسبت به سایر مدل های آماده شده متعلق به همان برنامه است. اجراهای با اولویت بالاتر میتوانند از منابع محاسباتی بیشتری نسبت به اجراهای با اولویت پایینتر استفاده کنند و میتوانند از اجرای با اولویت پایینتر جلوگیری کنند یا از آن جلوگیری کنند.
فراخوانی NN HAL 1.3 که شامل Priority
به عنوان یک آرگومان صریح است IDevice::prepareModel_1_3
است. توجه داشته باشید که IDevice::prepareModelFromCache_1_3
به طور ضمنی Priority
در آرگومان های کش گنجانده است.
بسته به توانایی های راننده و شتاب دهنده، استراتژی های ممکن زیادی برای پشتیبانی از اولویت ها وجود دارد. در اینجا چندین استراتژی وجود دارد:
- برای درایورهایی که پشتیبانی از اولویت داخلی دارند، فیلد
Priority
را مستقیماً در شتاب دهنده پخش کنید. - حتی قبل از اینکه اجرا به شتاب دهنده برسد، از یک صف اولویت برای هر برنامه برای پشتیبانی از اولویت های مختلف استفاده کنید.
مدلهای با اولویت پایین را که در حال اجرا هستند متوقف یا لغو کنید تا شتابدهنده برای اجرای مدلهای با اولویت بالا آزاد شود. Do this by either inserting checkpoints in low-priority models that, when reached, query a flag to determine whether the current execution should be halted prematurely or by partitioning the model into submodels and querying the flag between submodel executions. توجه داشته باشید که استفاده از نقاط بازرسی یا مدلهای فرعی در مدلهای آمادهشده با اولویت میتواند سربار اضافی را ایجاد کند که برای مدلهای بدون اولویت در نسخههای کمتر از NN HAL 1.3 وجود ندارد.
- برای پشتیبانی از Preemption، زمینه اجرا شامل عملیات بعدی یا مدل فرعی که باید اجرا شود و هر داده عملوند میانی مربوطه را حفظ کنید. از این زمینه اجرا برای از سرگیری اجرا در زمان دیگری استفاده کنید.
- پشتیبانی کامل Preemption لازم نیست، بنابراین زمینه اجرا نیازی به حفظ نیست. از آنجایی که اجرای مدل NNAPI قطعی است، اجراها را میتوان از ابتدا مجدداً شروع کرد.
Android سرویسها را قادر میسازد تا از طریق استفاده از AID (Android UID) بین برنامههای تماس مختلف تمایز قائل شوند. HIDL دارای مکانیسمهای داخلی برای بازیابی UID برنامه تماسگیرنده از طریق روش ::android::hardware::IPCThreadState::getCallingUid
. فهرستی از ایدزها را میتوانید در libcutils/include/cutils/android_filesystem_config.h
پیدا کنید.
مهلت ها
با شروع از اندروید 11، آماده سازی و اجرای مدل را می توان با آرگومان مهلت زمانی OptionalTimePoint
راه اندازی کرد. برای رانندگانی که می توانند مدت زمان انجام یک کار را تخمین بزنند، این مهلت به راننده اجازه می دهد تا کار را قبل از شروع آن متوقف کند، اگر راننده تخمین بزند که کار نمی تواند قبل از ضرب الاجل کامل شود. به طور مشابه، مهلت به راننده اجازه می دهد تا یک کار در حال انجام را که تخمین می زند قبل از مهلت تکمیل نمی شود، متوقف کند. استدلال ضربالاجل راننده را مجبور نمیکند تا یک کار را متوقف کند، اگر کار در مهلت مقرر کامل نشده باشد یا مهلت آن تمام شده باشد. آرگومان مهلت را می توان برای آزاد کردن منابع محاسباتی در درایور و بازگرداندن کنترل به برنامه سریعتر از آنچه که بدون ضرب الاجل ممکن است استفاده کرد.
فراخوانیهای NN HAL 1.3 که مهلتهای OptionalTimePoint
را به عنوان آرگومان شامل میشوند عبارتند از:
-
IDevice::prepareModel_1_3
-
IDevice::prepareModelFromCache_1_3
-
IPreparedModel::execute_1_3
-
IPreparedModel::executeSynchronously_1_3
-
IPreparedModel::executeFenced
برای مشاهده اجرای مرجع ویژگی ضربالاجل برای هر یک از روشهای بالا، درایور نمونه NNAPI را در frameworks/ml/nn/driver/sample/SampleDriver.cpp
ببینید.
کدهای خطا
اندروید 11 شامل چهار مقدار کد خطا در NN HAL 1.3 است تا گزارش خطا را بهبود بخشد و به رانندگان اجازه میدهد وضعیت خود را بهتر و برنامهها را برای بازیابی زیباتر ارتباط برقرار کنند. These are the error code values in ErrorStatus
.
-
MISSED_DEADLINE_TRANSIENT
-
MISSED_DEADLINE_PERSISTENT
-
RESOURCE_EXHAUSTED_TRANSIENT
-
RESOURCE_EXHAUSTED_PERSISTENT
در اندروید 10 یا پایینتر، یک درایور فقط از طریق کد خطای GENERAL_FAILURE
میتواند خطا را نشان دهد. From Android 11, the two MISSED_DEADLINE
error codes can be used to indicate that the workload was aborted because the deadline was reached or because the driver predicted the workload wouldn't complete by the deadline. دو کد خطای RESOURCE_EXHAUSTED
را می توان برای نشان دادن اینکه کار به دلیل محدودیت منابع در درایور، مانند نداشتن حافظه کافی برای تماس، انجام نشد، استفاده کرد.
نسخه TRANSIENT
هر دو خطا نشان میدهد که مشکل موقتی است و ممکن است تماسهای بعدی برای همان کار پس از تأخیر کوتاهی موفق شوند. به عنوان مثال، این کد خطا باید زمانی که راننده مشغول کار طولانی مدت یا پر منابع قبلی است، بازگردانده شود، اما اگر راننده با کار قبلی مشغول نبود، کار جدید با موفقیت انجام می شود. نسخه PERSISTENT
هر دو خطا نشان می دهد که همیشه انتظار می رود تماس های آینده برای یک کار مشابه با شکست مواجه شوند. به عنوان مثال، زمانی که راننده تخمین میزند که کار حتی در شرایط عالی نیز تا مهلت مقرر تکمیل نمیشود، یا اینکه مدل ذاتاً خیلی بزرگ است و از منابع راننده فراتر میرود، باید این کد خطا برگردانده شود.
اعتبار سنجی
کیفیت عملکرد سرویس در تست های NNAPI VTS ( VtsHalNeuralnetworksV1_3Target
) آزمایش می شود. این شامل مجموعهای از تستها برای اعتبارسنجی ( TestGenerated/ValidationTest#Test/
) برای اطمینان از اینکه راننده اولویتهای نامعتبر را رد میکند و مجموعهای از تستها به نام DeadlineTest
( TestGenerated/DeadlineTest#Test/
) است تا اطمینان حاصل شود که راننده به درستی ضربالاجلها را انجام میدهد.
با شروع از اندروید 11، NNAPI کیفیت خدمات (QoS) بهتری را با اجازه دادن به برنامه برای نشان دادن اولویت های نسبی مدل های خود، حداکثر زمان مورد انتظار برای آماده شدن یک مدل معین و حداکثر زمان مورد انتظار برای ارائه می دهد. یک اجرای معین باید تکمیل شود. علاوه بر این، Android 11 مقادیر اضافی خطای NNAPI را معرفی میکند که به یک سرویس امکان میدهد با دقت بیشتری نشان دهد که در صورت بروز نقص چه اشتباهی رخ داده است تا برنامه مشتری بتواند بهتر واکنش نشان دهد و بازیابی کند.
اولویت
برای Android 11 یا بالاتر، مدلها با اولویت در NN HAL 1.3 آماده شدهاند. این اولویت نسبت به سایر مدل های آماده شده متعلق به همان برنامه است. اجراهای با اولویت بالاتر میتوانند از منابع محاسباتی بیشتری نسبت به اجراهای با اولویت پایینتر استفاده کنند و میتوانند از اجرای با اولویت پایینتر جلوگیری کنند یا از آن جلوگیری کنند.
فراخوانی NN HAL 1.3 که شامل Priority
به عنوان یک آرگومان صریح است IDevice::prepareModel_1_3
است. Note that IDevice::prepareModelFromCache_1_3
implicitly includes Priority
in the cache arguments.
بسته به توانایی های راننده و شتاب دهنده، استراتژی های ممکن زیادی برای پشتیبانی از اولویت ها وجود دارد. در اینجا چندین استراتژی وجود دارد:
- For drivers that have built-in priority support, directly propagate the
Priority
field to the accelerator. - حتی قبل از اینکه اجرا به شتاب دهنده برسد، از یک صف اولویت برای هر برنامه برای پشتیبانی از اولویت های مختلف استفاده کنید.
مدلهای با اولویت پایین را که در حال اجرا هستند متوقف یا لغو کنید تا شتابدهنده برای اجرای مدلهای با اولویت بالا آزاد شود. این کار را با قرار دادن نقاط بازرسی در مدلهای با اولویت پایین انجام دهید که پس از رسیدن به آن، پرچمی را برای تعیین اینکه آیا اجرای فعلی باید زودتر از موعد متوقف شود یا با تقسیم کردن مدل به مدلهای فرعی و جستجوی پرچم بین اجرای زیرمدل، درخواست میکند. توجه داشته باشید که استفاده از نقاط بازرسی یا مدلهای فرعی در مدلهای آمادهشده با اولویت میتواند سربار اضافی را ایجاد کند که برای مدلهای بدون اولویت در نسخههای کمتر از NN HAL 1.3 وجود ندارد.
- برای پشتیبانی از Preemption، زمینه اجرا شامل عملیات بعدی یا مدل فرعی که باید اجرا شود و هر داده عملوند میانی مربوطه را حفظ کنید. از این زمینه اجرا برای از سرگیری اجرا در زمان دیگری استفاده کنید.
- پشتیبانی کامل Preemption لازم نیست، بنابراین زمینه اجرا نیازی به حفظ نیست. از آنجایی که اجرای مدل NNAPI قطعی است، اجراها را میتوان از ابتدا مجدداً شروع کرد.
Android سرویسها را قادر میسازد تا از طریق استفاده از AID (Android UID) بین برنامههای تماس مختلف تمایز قائل شوند. HIDL دارای مکانیسمهای داخلی برای بازیابی UID برنامه تماسگیرنده از طریق روش ::android::hardware::IPCThreadState::getCallingUid
. فهرستی از ایدزها را میتوانید در libcutils/include/cutils/android_filesystem_config.h
پیدا کنید.
مهلت ها
با شروع از اندروید 11، آماده سازی و اجرای مدل را می توان با آرگومان مهلت زمانی OptionalTimePoint
راه اندازی کرد. برای رانندگانی که می توانند مدت زمان انجام یک کار را تخمین بزنند، این مهلت به راننده اجازه می دهد تا کار را قبل از شروع آن متوقف کند، اگر راننده تخمین بزند که کار نمی تواند قبل از ضرب الاجل کامل شود. به طور مشابه، مهلت به راننده اجازه می دهد تا یک کار در حال انجام را که تخمین می زند قبل از مهلت تکمیل نمی شود، متوقف کند. استدلال ضربالاجل راننده را مجبور نمیکند تا یک کار را متوقف کند، اگر کار در مهلت مقرر کامل نشده باشد یا مهلت آن تمام شده باشد. آرگومان مهلت را می توان برای آزاد کردن منابع محاسباتی در درایور و بازگرداندن کنترل به برنامه سریعتر از آنچه که بدون ضرب الاجل ممکن است استفاده کرد.
فراخوانیهای NN HAL 1.3 که مهلتهای OptionalTimePoint
را به عنوان آرگومان شامل میشوند عبارتند از:
-
IDevice::prepareModel_1_3
-
IDevice::prepareModelFromCache_1_3
-
IPreparedModel::execute_1_3
-
IPreparedModel::executeSynchronously_1_3
-
IPreparedModel::executeFenced
To see a reference implementation of the deadline feature for each of the above methods, see the NNAPI sample driver at frameworks/ml/nn/driver/sample/SampleDriver.cpp
.
کدهای خطا
اندروید 11 شامل چهار مقدار کد خطا در NN HAL 1.3 است تا گزارش خطا را بهبود بخشد و به رانندگان اجازه میدهد وضعیت خود را بهتر و برنامهها را برای بازیابی زیباتر ارتباط برقرار کنند. These are the error code values in ErrorStatus
.
-
MISSED_DEADLINE_TRANSIENT
-
MISSED_DEADLINE_PERSISTENT
-
RESOURCE_EXHAUSTED_TRANSIENT
-
RESOURCE_EXHAUSTED_PERSISTENT
در اندروید 10 یا پایینتر، یک درایور فقط از طریق کد خطای GENERAL_FAILURE
میتواند خطا را نشان دهد. از Android 11، از دو کد خطای MISSED_DEADLINE
میتوان برای نشان دادن این که حجم کار به دلیل پایان مهلت مقرر یا به دلیل اینکه راننده پیشبینی کرده بود حجم کار تا مهلت مقرر تکمیل نمیشود، متوقف شده است، استفاده شود. دو کد خطای RESOURCE_EXHAUSTED
را می توان برای نشان دادن اینکه کار به دلیل محدودیت منابع در درایور، مانند نداشتن حافظه کافی برای تماس، انجام نشد، استفاده کرد.
نسخه TRANSIENT
هر دو خطا نشان میدهد که مشکل موقتی است و ممکن است تماسهای بعدی برای همان کار پس از تأخیر کوتاهی موفق شوند. به عنوان مثال، این کد خطا باید زمانی که راننده مشغول کار طولانی مدت یا پر منابع قبلی است، بازگردانده شود، اما اگر راننده با کار قبلی مشغول نبود، کار جدید با موفقیت انجام می شود. نسخه PERSISTENT
هر دو خطا نشان می دهد که همیشه انتظار می رود تماس های آینده برای یک کار مشابه با شکست مواجه شوند. به عنوان مثال، زمانی که راننده تخمین میزند که کار حتی در شرایط عالی نیز تا مهلت مقرر تکمیل نمیشود، یا اینکه مدل ذاتاً خیلی بزرگ است و از منابع راننده فراتر میرود، باید این کد خطا برگردانده شود.
اعتبار سنجی
کیفیت عملکرد سرویس در تست های NNAPI VTS ( VtsHalNeuralnetworksV1_3Target
) آزمایش می شود. This includes a set of tests for validation ( TestGenerated/ValidationTest#Test/
) to ensure that the driver rejects invalid priorities and a set of tests called DeadlineTest
( TestGenerated/DeadlineTest#Test/
) to ensure that the driver handles deadlines correctly.
با شروع از اندروید 11، NNAPI کیفیت خدمات (QoS) بهتری را با اجازه دادن به برنامه برای نشان دادن اولویت های نسبی مدل های خود، حداکثر زمان مورد انتظار برای آماده شدن یک مدل معین و حداکثر زمان مورد انتظار برای ارائه می دهد. یک اجرای معین باید تکمیل شود. علاوه بر این، Android 11 مقادیر اضافی خطای NNAPI را معرفی میکند که به یک سرویس امکان میدهد با دقت بیشتری نشان دهد که در صورت بروز نقص چه اشتباهی رخ داده است تا برنامه مشتری بتواند بهتر واکنش نشان دهد و بازیابی کند.
اولویت
برای Android 11 یا بالاتر، مدلها با اولویت در NN HAL 1.3 آماده شدهاند. این اولویت نسبت به سایر مدل های آماده شده متعلق به همان برنامه است. اجراهای با اولویت بالاتر میتوانند از منابع محاسباتی بیشتری نسبت به اجراهای با اولویت پایینتر استفاده کنند و میتوانند از اجرای با اولویت پایینتر جلوگیری کنند یا از آن جلوگیری کنند.
فراخوانی NN HAL 1.3 که شامل Priority
به عنوان یک آرگومان صریح است IDevice::prepareModel_1_3
است. توجه داشته باشید که IDevice::prepareModelFromCache_1_3
به طور ضمنی Priority
در آرگومان های حافظه پنهان گنجانده است.
بسته به توانایی های راننده و شتاب دهنده، استراتژی های ممکن زیادی برای پشتیبانی از اولویت ها وجود دارد. در اینجا چندین استراتژی وجود دارد:
- برای درایورهایی که پشتیبانی از اولویت داخلی دارند، فیلد
Priority
را مستقیماً در شتاب دهنده پخش کنید. - حتی قبل از اینکه اجرا به شتاب دهنده برسد، از یک صف اولویت برای هر برنامه برای پشتیبانی از اولویت های مختلف استفاده کنید.
مدلهای با اولویت پایین را که در حال اجرا هستند متوقف یا لغو کنید تا شتابدهنده برای اجرای مدلهای با اولویت بالا آزاد شود. Do this by either inserting checkpoints in low-priority models that, when reached, query a flag to determine whether the current execution should be halted prematurely or by partitioning the model into submodels and querying the flag between submodel executions. توجه داشته باشید که استفاده از نقاط بازرسی یا مدلهای فرعی در مدلهای آمادهشده با اولویت میتواند سربار اضافی را ایجاد کند که برای مدلهای بدون اولویت در نسخههای کمتر از NN HAL 1.3 وجود ندارد.
- برای پشتیبانی از Preemption، زمینه اجرا شامل عملیات بعدی یا مدل فرعی که باید اجرا شود و هر داده عملوند میانی مربوطه را حفظ کنید. از این زمینه اجرا برای از سرگیری اجرا در زمان دیگری استفاده کنید.
- پشتیبانی کامل Preemption لازم نیست، بنابراین زمینه اجرا نیازی به حفظ نیست. از آنجایی که اجرای مدل NNAPI قطعی است، اجراها را میتوان از ابتدا مجدداً شروع کرد.
Android سرویسها را قادر میسازد تا از طریق استفاده از AID (Android UID) بین برنامههای تماس مختلف تمایز قائل شوند. HIDL دارای مکانیسمهای داخلی برای بازیابی UID برنامه تماسگیرنده از طریق روش ::android::hardware::IPCThreadState::getCallingUid
. فهرستی از ایدزها را میتوانید در libcutils/include/cutils/android_filesystem_config.h
پیدا کنید.
مهلت ها
با شروع از اندروید 11، آماده سازی و اجرای مدل را می توان با آرگومان مهلت زمانی OptionalTimePoint
راه اندازی کرد. برای رانندگانی که می توانند مدت زمان انجام یک کار را تخمین بزنند، این مهلت به راننده اجازه می دهد تا کار را قبل از شروع آن متوقف کند، اگر راننده تخمین بزند که کار نمی تواند قبل از ضرب الاجل کامل شود. به طور مشابه، مهلت به راننده اجازه می دهد تا یک کار در حال انجام را که تخمین می زند قبل از مهلت تکمیل نمی شود، متوقف کند. استدلال ضربالاجل راننده را مجبور نمیکند تا یک کار را متوقف کند، اگر کار در مهلت مقرر کامل نشده باشد یا مهلت آن تمام شده باشد. آرگومان مهلت را می توان برای آزاد کردن منابع محاسباتی در درایور و بازگرداندن کنترل به برنامه سریعتر از آنچه که بدون ضرب الاجل ممکن است استفاده کرد.
فراخوانیهای NN HAL 1.3 که مهلتهای OptionalTimePoint
را به عنوان آرگومان شامل میشوند عبارتند از:
-
IDevice::prepareModel_1_3
-
IDevice::prepareModelFromCache_1_3
-
IPreparedModel::execute_1_3
-
IPreparedModel::executeSynchronously_1_3
-
IPreparedModel::executeFenced
To see a reference implementation of the deadline feature for each of the above methods, see the NNAPI sample driver at frameworks/ml/nn/driver/sample/SampleDriver.cpp
.
کدهای خطا
اندروید 11 شامل چهار مقدار کد خطا در NN HAL 1.3 است تا گزارش خطا را بهبود بخشد و به رانندگان اجازه میدهد وضعیت خود را بهتر و برنامهها را برای بازیابی زیباتر ارتباط برقرار کنند. اینها مقادیر کد خطا در ErrorStatus
هستند.
-
MISSED_DEADLINE_TRANSIENT
-
MISSED_DEADLINE_PERSISTENT
-
RESOURCE_EXHAUSTED_TRANSIENT
-
RESOURCE_EXHAUSTED_PERSISTENT
در اندروید 10 یا پایینتر، یک درایور فقط از طریق کد خطای GENERAL_FAILURE
میتواند خطا را نشان دهد. از Android 11، از دو کد خطای MISSED_DEADLINE
میتوان برای نشان دادن این که حجم کار به دلیل پایان مهلت مقرر یا به دلیل اینکه راننده پیشبینی کرده بود حجم کار تا مهلت مقرر تکمیل نمیشود، متوقف شده است، استفاده شود. دو کد خطای RESOURCE_EXHAUSTED
را می توان برای نشان دادن اینکه کار به دلیل محدودیت منابع در درایور، مانند نداشتن حافظه کافی برای تماس، انجام نشد، استفاده کرد.
نسخه TRANSIENT
هر دو خطا نشان میدهد که مشکل موقتی است و ممکن است تماسهای بعدی برای همان کار پس از تأخیر کوتاهی موفق شوند. به عنوان مثال، این کد خطا باید زمانی که راننده مشغول کار طولانی مدت یا پر منابع قبلی است، بازگردانده شود، اما اگر راننده با کار قبلی مشغول نبود، کار جدید با موفقیت انجام می شود. نسخه PERSISTENT
هر دو خطا نشان می دهد که همیشه انتظار می رود تماس های آینده برای یک کار مشابه با شکست مواجه شوند. به عنوان مثال، زمانی که راننده تخمین میزند که کار حتی در شرایط عالی نیز تا مهلت مقرر تکمیل نمیشود، یا اینکه مدل ذاتاً خیلی بزرگ است و از منابع راننده فراتر میرود، باید این کد خطا برگردانده شود.
اعتبار سنجی
کیفیت عملکرد سرویس در تست های NNAPI VTS ( VtsHalNeuralnetworksV1_3Target
) آزمایش می شود. این شامل مجموعهای از تستها برای اعتبارسنجی ( TestGenerated/ValidationTest#Test/
) برای اطمینان از اینکه راننده اولویتهای نامعتبر را رد میکند و مجموعهای از تستها به نام DeadlineTest
( TestGenerated/DeadlineTest#Test/
) است تا اطمینان حاصل شود که راننده به درستی ضربالاجلها را انجام میدهد.