Neural Networks HAL 1.2 מציג את המושג של ביצוע רצפי מודעות. רצף הפעלות הן רצף של הפעלות של אותו מודל מוכן שמתרחשות במהירות רבה, למשל כאלה שפועלים על פריימים של צילום במצלמה אודיו עוקב דוגמאות. אובייקט זרימה משמש לניהול קבוצה של פעולות זרימה, ולשימור משאבים בין פעולות, וכך מאפשר להפחית את התקורה של הפעולות. אובייקטים של רצף רציף מאפשרים לבצע שלוש אופטימיזציות:
- אובייקט רצף נוצר לפני רצף של הפעלות ושחרורו כשהרצף מסתיים. לכן, משך החיים של התפרצות לנהג שרומז לנהג כמה זמן הוא צריך להישאר .
- אובייקט זרימה יכול לשמור משאבים בין פעולות. לדוגמה, אפשר למפות אובייקט זיכרון בזמן הביצוע הראשון ולשמור את המיפוי במטמון באובייקט ה-burst לשימוש חוזר בפעולות הבאות. אפשר לשחרר כל משאב שנשמר במטמון כשאובייקט ה-burst נהרס או כשסביבת זמן הריצה של NNAPI מודיעה לאובייקט ה-burst שהמשאב כבר לא נדרש.
- אובייקט רצף משתמש תורים מהירים להודעות (FMQ) לתקשורת בין האפליקציה לתהליכי הנהג. מי יכול מפחיתים את זמן האחזור כי ה-FMQ עוקף את HIDL ומעביר את הנתונים ישירות אל תהליך נוסף דרך FIFO מעגלי אטומי בזיכרון משותף. תהליך הצרכן יודע להסיר פריט מהתור ולהתחיל עיבוד על ידי סקירה של מספר הרכיבים ב-FIFO או על ידי המתנה לדגל האירוע של FMQ, שמקבל אות מהבעלים. סימון אירוע זה הוא מהיר userspace mutex (futex).
FMQ היא מבנה נתונים ברמה נמוכה שלא מציע ערבויות לטווח ארוך בכל התהליכים, ואין לו מנגנון מובנה לקביעת אם התהליך בקצה השני של ה-FMQ פועל כצפוי. כתוצאה מכך, אם המפיק של שה-FMQ מת, הצרכן עלול להיות תקוע ומחכה לנתונים שלא מגיעים. פתרון אחד לבעיה הזו הוא שהנהג משייך את ה-FMQs לאובייקט ה-burst ברמה גבוהה יותר כדי לזהות מתי ביצוע ה-burst הסתיים.
כי הפעלות רצפים פועלות על אותם ארגומנטים ומחזירות אותם
תוצאות כמו נתיבי הפעלה אחרים, ערוצי ה-FMQ הבסיסיים חייבים להעביר את אותם נתונים
ומנהלי ההתקנים של שירות NNAPI. עם זאת, ממשקי FMQ יכולים להעביר רק
סוגי נתונים ישנים. העברת נתונים מורכבים מתבצעת באמצעות סריאליזציה
ועושים דה-סריאליזציה של מאגרי נתונים זמניים מקוננים (סוגי וקטורים) ישירות ב-FMQ, באמצעות
אובייקטים של קריאה חוזרת (callback) מסוג HIDL להעברת כינויים של מאגרי זיכרון על פי דרישה. הצד של הבעלים ב-FMQ חייב לשלוח את הודעות הבקשה או התוצאה לצרכנים באופן אטומי באמצעות MessageQueue::writeBlocking
אם התור חסום, או באמצעות MessageQueue::write
אם התור לא חסום.
ממשקי Burst
ממשקי ה-burst של HAL של רשתות נוירונליות נמצאים ב-hardware/interfaces/neuralnetworks/1.2/
ומתווארים בהמשך. למידע נוסף על ממשקי התפרצות בשכבת NDK, ראו frameworks/ml/nn/runtime/include/NeuralNetworks.h
.
types.hal
types.hal
מגדיר את סוג הנתונים שנשלחים דרך FMQ.
FmqRequestDatum
: רכיב יחיד של ייצוג טורי של ביצועRequest
אובייקט וערךMeasureTiming
, שנשלחים דרך ההודעה המהירה לרשימת 'הבאים בתור'.FmqResultDatum
: רכיב יחיד של ייצוג בסדרה של הערכים שמוחזרים מההרצה (ErrorStatus
,OutputShapes
ו-Timing
), שמוחזרים דרך תור ההודעות המהיר.
IBurstContext.hal
IBurstContext.hal
מגדיר את אובייקט הממשק של HIDL שנמצא בשירות Neural Networks.
IBurstContext
: אובייקט הקשר לניהול המשאבים של רצף נתונים.
IBurstCallback.hal
IBurstCallback.hal
מגדיר את אובייקט הממשק של HIDL לקריאה חוזרת (callback) שנוצרה על ידי סביבת זמן הריצה של רשתות העצבים, ומשמש את שירות רשתות העצבים לאחזור אובייקטים מסוג hidl_memory
שתואמים למזהי חריצי זיכרון.
- IBurstCallback: אובייקט קריאה חוזרת (callback) ששירות משתמש בו כדי לאחזר אובייקטים בזיכרון.
IpredModel.hal
ב-HAL 1.2, IPreparedModel.hal
מרחיב את השיטה ליצירת אובייקט IBurstContext
מתוך מודל מוכן.
configureExecutionBurst
: הגדרת אובייקט 'פרץ נתונים' שמשמשים לביצוע מספר מסקנות ברצף מהיר על מודל מוכן.
תמיכה בהרצות קצרות (burst) ב-driver
הדרך הפשוטה ביותר לתמוך באובייקטים ברצף בשירות HIDL NNAPI היא להשתמש
פונקציית רצף התשתיות ::android::nn::ExecutionBurstServer::create
, שהיא
נמצא ב
ExecutionBurstServer.h
ארוזים בlibneuralnetworks_common
ובlibneuralnetworks_util
של ספריות סטטיות. לפונקציה של היצרן יש שני עומסי יתר:
- עומס יתר אחד מקבל מצביע לאובייקט
IPreparedModel
. הזה פונקציית השירות משתמשת ב-methodexecuteSynchronously
IPreparedModel
כדי להפעיל את המודל. - עומס יתר אחד מקבל אובייקט
IBurstExecutorWithCache
שניתן להתאמה אישית, שאפשר להשתמש בו כדי לשמור במטמון משאבים (כמו מיפויים שלhidl_memory
) מופיעים בכמה ניסיונות הפעלה.
כל עומס יתר מחזיר אובייקט IBurstContext
(שמייצג את אובייקט ההתפרצות) שמכיל ומנהל את שרשור המאזין הייעודי שלו. השרשור הזה
מקבל בקשות מ-FMQ requestChannel
, מבצע את ההסקה, ואז
מחזירה את התוצאות באמצעות ה-FMQ של resultChannel
. השרשור הזה וכל שאר ההודעות
המשאבים הכלולים באובייקט IBurstContext
משוחררים באופן אוטומטי
כשהלקוח של סדרת התמונות מאבד את ההפניה אל IBurstContext
.
לחלופין, אתם יכולים ליצור יישום משלכם של IBurstContext
,
מבין איך לשלוח ולקבל הודעות באמצעות requestChannel
resultChannel
תדרי FMQ הועברו אל IPreparedModel::configureExecutionBurst
.
פונקציות השירות של רצף התמונות נמצאות ב-ExecutionBurstServer.h
.
/**
* Create automated context to manage FMQ-based executions.
*
* This function is intended to be used by a service to automatically:
* 1) Receive data from a provided FMQ
* 2) Execute a model with the given information
* 3) Send the result to the created FMQ
*
* @param callback Callback used to retrieve memories corresponding to
* unrecognized slots.
* @param requestChannel Input FMQ channel through which the client passes the
* request to the service.
* @param resultChannel Output FMQ channel from which the client can retrieve
* the result of the execution.
* @param executorWithCache Object which maintains a local cache of the
* memory pools and executes using the cached memory pools.
* @result IBurstContext Handle to the burst context.
*/
static sp<ExecutionBurstServer> create(
const sp<IBurstCallback>& callback, const FmqRequestDescriptor& requestChannel,
const FmqResultDescriptor& resultChannel,
std::shared_ptr<IBurstExecutorWithCache> executorWithCache);
/**
* Create automated context to manage FMQ-based executions.
*
* This function is intended to be used by a service to automatically:
* 1) Receive data from a provided FMQ
* 2) Execute a model with the given information
* 3) Send the result to the created FMQ
*
* @param callback Callback used to retrieve memories corresponding to
* unrecognized slots.
* @param requestChannel Input FMQ channel through which the client passes the
* request to the service.
* @param resultChannel Output FMQ channel from which the client can retrieve
* the result of the execution.
* @param preparedModel PreparedModel that the burst object was created from.
* IPreparedModel::executeSynchronously will be used to perform the
* execution.
* @result IBurstContext Handle to the burst context.
*/
static sp<ExecutionBurstServer> create(const sp<IBurstCallback>& callback,
const FmqRequestDescriptor& requestChannel,
const FmqResultDescriptor& resultChannel,
IPreparedModel* preparedModel);
בהמשך מופיע יישום ייחוס של ממשק התפרצות שנמצא ב-Neural Networks sample driver frameworks/ml/nn/driver/sample/SampleDriver.cpp
.
Return<void> SamplePreparedModel::configureExecutionBurst(
const sp<V1_2::IBurstCallback>& callback,
const MQDescriptorSync<V1_2::FmqRequestDatum>& requestChannel,
const MQDescriptorSync<V1_2::FmqResultDatum>& resultChannel,
configureExecutionBurst_cb cb) {
NNTRACE_FULL(NNTRACE_LAYER_DRIVER, NNTRACE_PHASE_EXECUTION,
"SampleDriver::configureExecutionBurst");
// Alternatively, the burst could be configured via:
// const sp<V1_2::IBurstContext> burst =
// ExecutionBurstServer::create(callback, requestChannel,
// resultChannel, this);
//
// However, this alternative representation does not include a memory map
// caching optimization, and adds overhead.
const std::shared_ptr<BurstExecutorWithCache> executorWithCache =
std::make_shared<BurstExecutorWithCache>(mModel, mDriver, mPoolInfos);
const sp<V1_2::IBurstContext> burst = ExecutionBurstServer::create(
callback, requestChannel, resultChannel, executorWithCache);
if (burst == nullptr) {
cb(ErrorStatus::GENERAL_FAILURE, {});
} else {
cb(ErrorStatus::NONE, burst);
}
return Void();
}