ตั้งแต่ปี 2026 เป็นต้นไป เราจะเผยแพร่ซอร์สโค้ดไปยัง AOSP ในไตรมาสที่ 2 และ 4 เพื่อให้สอดคล้องกับโมเดลการพัฒนาแบบ Trunk Stable และรับประกันความเสถียรของแพลตฟอร์มสำหรับระบบนิเวศ หากต้องการสร้างและมีส่วนร่วมใน AOSP ให้ใช้ android-latest-release android-latest-release สาขา Manifest จะอ้างอิงถึงรุ่นล่าสุดที่พุชไปยัง AOSP เสมอ ดูข้อมูลเพิ่มเติมได้ที่การเปลี่ยนแปลงใน AOSP

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

ไดรเวอร์ API เครือข่ายระบบประสาท

หน้านี้ให้ภาพรวมเกี่ยวกับวิธีติดตั้งใช้งานไดรเวอร์ Neural Networks API (NNAPI) ดูรายละเอียดเพิ่มเติมได้ในเอกสารประกอบที่อยู่ในไฟล์คำจำกัดความ HAL ใน hardware/interfaces/neuralnetworks ตัวอย่างการใช้งานไดรเวอร์อยู่ใน frameworks/ml/nn/driver/sample

ดูข้อมูลเพิ่มเติมเกี่ยวกับ Neural Networks API ได้ที่ Neural Networks API

HAL ของโครงข่ายประสาท

HAL ของเครือข่ายประสาทเทียม (NN) จะกำหนดการแยกส่วนของอุปกรณ์ต่างๆ เช่น หน่วยประมวลผลกราฟิก (GPU) และหน่วยประมวลผลสัญญาณดิจิทัล (DSP) ที่อยู่ในผลิตภัณฑ์ (เช่น โทรศัพท์หรือแท็บเล็ต) ไดรเวอร์สำหรับอุปกรณ์เหล่านี้ต้องเป็นไปตาม NN HAL อินเทอร์เฟซระบุอยู่ในไฟล์คำจำกัดความ HAL ใน hardware/interfaces/neuralnetworks

โฟลว์ทั่วไปของอินเทอร์เฟซระหว่างเฟรมเวิร์กกับไดรเวอร์แสดงอยู่ในรูปที่ 1

โฟลว์ของโครงข่ายระบบประสาทเทียม

รูปที่ 1 โฟลว์ของโครงข่ายระบบประสาทเทียม

การเริ่มต้น

เมื่อเริ่มต้น เฟรมเวิร์กจะค้นหาความสามารถของไดรเวอร์โดยใช้ IDevice::getCapabilities_1_3 โครงสร้าง @1.3::Capabilities มีข้อมูลทุกประเภทและ แสดงประสิทธิภาพที่ไม่ผ่อนคลายโดยใช้เวกเตอร์

เฟรมเวิร์กจะใช้ความสามารถเพื่อทำความเข้าใจว่าไดรเวอร์แต่ละตัวสามารถดำเนินการได้รวดเร็วและประหยัดพลังงานเพียงใด เพื่อกำหนดวิธีจัดสรรการคำนวณให้กับอุปกรณ์ที่พร้อมใช้งาน หากต้องการให้ข้อมูลนี้ ไดรเวอร์ต้องระบุตัวเลขประสิทธิภาพที่ได้มาตรฐานตามการดำเนินการ ของปริมาณงานอ้างอิง

หากต้องการกำหนดค่าที่ไดรเวอร์แสดงในการตอบกลับ IDevice::getCapabilities_1_3 ให้ใช้แอปการทดสอบ NNAPI เพื่อวัด ประสิทธิภาพสำหรับประเภทข้อมูลที่เกี่ยวข้อง เราขอแนะนำให้ใช้โมเดล MobileNet v1 และ v2, asr_float, และ tts_float ในการวัดประสิทธิภาพสำหรับค่าทศนิยมแบบ 32 บิต และโมเดลที่แปลงเป็นควอนไทซ์ของ MobileNet v1 และ v2 สำหรับค่าที่แปลงเป็นควอนไทซ์แบบ 8 บิต ดูข้อมูลเพิ่มเติมได้ที่ ชุดทดสอบแมชชีนเลิร์นนิงของ Android

ใน Android 9 และเวอร์ชันที่ต่ำกว่า โครงสร้าง Capabilities จะมีข้อมูลประสิทธิภาพของไดรเวอร์ เฉพาะสำหรับเทนเซอร์แบบทศนิยมและเทนเซอร์ที่ผ่านการควอนไทซ์ และไม่มี ประเภทข้อมูลสเกลาร์

ในกระบวนการเริ่มต้น เฟรมเวิร์กอาจค้นหาข้อมูลเพิ่มเติมโดยใช้ IDevice::getType, IDevice::getVersionString, IDevice:getSupportedExtensions และ IDevice::getNumberOfCacheFilesNeeded

ในระหว่างการรีบูตผลิตภัณฑ์ เฟรมเวิร์กคาดหวังว่าการค้นหาทั้งหมดที่อธิบายไว้ในส่วนนี้จะรายงานค่าเดียวกันเสมอสำหรับไดรเวอร์ที่กำหนด ไม่เช่นนั้น แอป ที่ใช้ไดรเวอร์นั้นอาจมีประสิทธิภาพลดลงหรือทำงานไม่ถูกต้อง

การรวบรวม

เฟรมเวิร์กจะกำหนดอุปกรณ์ที่จะใช้เมื่อได้รับคำขอจากแอป ใน Android 10 แอปจะค้นหาและระบุอุปกรณ์ที่เฟรมเวิร์กเลือกได้ ดูข้อมูลเพิ่มเติมได้ที่การค้นหาและการกำหนดอุปกรณ์

ในเวลาที่คอมไพล์โมเดล เฟรมเวิร์กจะส่งโมเดลไปยังไดรเวอร์แต่ละตัวที่เข้าเกณฑ์โดยการเรียกใช้ IDevice::getSupportedOperations_1_3 ไดรเวอร์แต่ละตัวจะแสดงอาร์เรย์ของบูลีนที่ระบุว่ารองรับการดำเนินการใดของโมเดล ไดรเวอร์อาจพิจารณาว่าไม่สามารถ รองรับการดำเนินการหนึ่งๆ ได้ด้วยเหตุผลหลายประการ เช่น

ไดรเวอร์ไม่รองรับประเภทข้อมูล
ไดรเวอร์รองรับเฉพาะการดำเนินการที่มีพารามิเตอร์อินพุตที่เฉพาะเจาะจง ตัวอย่างเช่น ไดรเวอร์อาจรองรับการดำเนินการ Convolution ขนาด 3x3 และ 5x5 แต่ไม่รองรับขนาด 7x7
ไดรเวอร์มีข้อจำกัดด้านหน่วยความจำที่ทำให้ไม่สามารถจัดการกราฟหรืออินพุตขนาดใหญ่ได้

ในระหว่างการคอมไพล์ อินพุต เอาต์พุต และตัวถูกดำเนินการภายในของโมเดลตามที่อธิบายไว้ในOperandLifeTime อาจมีมิติข้อมูลหรืออันดับที่ไม่รู้จัก ดูข้อมูลเพิ่มเติมได้ที่ รูปร่างเอาต์พุต

เฟรมเวิร์กจะสั่งให้ไดรเวอร์แต่ละตัวที่เลือกเตรียมพร้อมที่จะเรียกใช้ชุดย่อยของโมเดลโดยการเรียกใช้ IDevice::prepareModel_1_3 จากนั้นไดรเวอร์แต่ละตัวจะคอมไพล์ชุดย่อยของตัวเอง ตัวอย่างเช่น ไดรเวอร์อาจ สร้างโค้ดหรือสร้างสำเนาของน้ำหนักที่เรียงลำดับใหม่ เนื่องจากอาจใช้เวลานานพอสมควรระหว่างการคอมไพล์โมเดลกับการ ดำเนินการคำขอ จึงไม่ควรจัดสรรทรัพยากร เช่น หน่วยความจำของอุปกรณ์จำนวนมาก ในระหว่างการคอมไพล์

เมื่อสำเร็จ ไดรเวอร์จะแสดง@1.3::IPreparedModel แฮนเดิล หากไดรเวอร์แสดงรหัสข้อผิดพลาดเมื่อเตรียมชุดย่อยของ โมเดล เฟรมเวิร์กจะเรียกใช้โมเดลทั้งหมดใน CPU

ไดรเวอร์สามารถแคชอาร์ติแฟกต์การคอมไพล์เพื่อลดเวลาที่ใช้ในการคอมไพล์เมื่อแอปเริ่มต้น ดูข้อมูลเพิ่มเติมได้ที่การแคช การคอมไพล์

การลงมือปฏิบัติ

เมื่อแอปขอให้เฟรมเวิร์กดำเนินการคำขอ เฟรมเวิร์กจะเรียกใช้เมธอด HAL ของ IPreparedModel::executeSynchronously_1_3 โดยค่าเริ่มต้นเพื่อดำเนินการพร้อมกันในโมเดลที่เตรียมไว้ นอกจากนี้ คุณยังเรียกใช้คำขอแบบไม่พร้อมกันได้โดยใช้เมธอด execute_1_3 เมธอด executeFenced (ดูการดำเนินการแบบจำกัด) หรือเรียกใช้โดยใช้การดำเนินการแบบกลุ่ม

การเรียกใช้แบบซิงโครนัสช่วยปรับปรุงประสิทธิภาพและลดค่าใช้จ่ายในการสร้างเธรด เมื่อเทียบกับการเรียกใช้แบบอะซิงโครนัส เนื่องจากระบบจะส่งคืนการควบคุมไปยัง กระบวนการของแอปหลังจากดำเนินการเสร็จสมบูรณ์แล้วเท่านั้น ซึ่งหมายความว่า ไดรเวอร์ไม่จำเป็นต้องมีกลไกแยกต่างหากเพื่อแจ้งกระบวนการของแอปว่า การดำเนินการเสร็จสมบูรณ์แล้ว

เมื่อใช้เมธอด execute_1_3 แบบอะซิงโครนัส การควบคุมจะกลับไปที่กระบวนการของแอปหลังจากที่การดำเนินการเริ่มต้นขึ้น และไดรเวอร์ต้องแจ้งให้เฟรมเวิร์กทราบเมื่อการดำเนินการเสร็จสมบูรณ์โดยใช้ @1.3::IExecutionCallback

Request พารามิเตอร์ที่ส่งไปยังเมธอด execute จะแสดงรายการอินพุตและเอาต์พุต ตัวถูกดำเนินการที่ใช้สำหรับการดำเนินการ หน่วยความจำที่จัดเก็บข้อมูลตัวถูกดำเนินการต้อง ใช้ลำดับแถวหลักโดยที่มิติข้อมูลแรกวนซ้ำช้าที่สุด และไม่มี การเว้นวรรคที่ท้ายแถว ดูข้อมูลเพิ่มเติมเกี่ยวกับประเภทตัวถูกดำเนินการได้ที่ ตัวถูกดำเนินการ

สำหรับไดรเวอร์ NN HAL 1.2 ขึ้นไป เมื่อคำขอเสร็จสมบูรณ์ ระบบจะส่งคืนสถานะข้อผิดพลาด รูปร่างเอาต์พุต และข้อมูลเวลาไปยังเฟรมเวิร์ก ในระหว่างการดำเนินการ เอาต์พุตหรือตัวถูกดำเนินการภายในของโมเดลอาจมีมิติข้อมูลที่ไม่รู้จักอย่างน้อย 1 รายการหรืออันดับที่ไม่รู้จัก เมื่อตัวถูกดำเนินการเอาต์พุตอย่างน้อย 1 รายการมีมิติข้อมูลหรืออันดับที่ไม่รู้จัก ไดรเวอร์ต้องแสดงข้อมูลเอาต์พุตที่มีขนาดแบบไดนามิก

สำหรับไดรเวอร์ที่มี NN HAL 1.1 หรือต่ำกว่า ระบบจะแสดงเฉพาะสถานะข้อผิดพลาดเมื่อคำขอเสร็จสมบูรณ์ ต้องระบุขนาดสำหรับตัวถูกดำเนินการอินพุตและเอาต์พุตอย่างครบถ้วน เพื่อให้การดำเนินการเสร็จสมบูรณ์ ตัวถูกดำเนินการภายในอาจมีมิติข้อมูลที่ไม่รู้จักอย่างน้อย 1 รายการ แต่ต้องมีอันดับที่ระบุ

สำหรับคำขอของผู้ใช้ที่ครอบคลุมไดรเวอร์หลายตัว เฟรมเวิร์กมีหน้าที่ จองหน่วยความจำกลางและจัดลำดับการเรียกไปยังไดรเวอร์แต่ละตัว

คุณสามารถเริ่มคำขอหลายรายการพร้อมกันใน@1.3::IPreparedModelเดียวกันได้ ไดรเวอร์สามารถดำเนินการตามคำขอแบบขนานหรือแบบอนุกรมได้

เฟรมเวิร์กสามารถขอให้ไดรเวอร์เก็บโมเดลที่เตรียมไว้มากกว่า 1 รายการ เช่น เตรียมโมเดล m1 เตรียม m2 ดำเนินการคำขอ r1 ใน m1 ดำเนินการ r2 ใน m2 ดำเนินการ r3 ใน m1 ดำเนินการ r4 ใน m2 เผยแพร่ (อธิบายไว้ในการล้างข้อมูล) m1 และเผยแพร่ m2

เพื่อหลีกเลี่ยงการดำเนินการครั้งแรกที่ช้าซึ่งอาจส่งผลให้ผู้ใช้ได้รับประสบการณ์การใช้งานที่ไม่ดี (เช่น เฟรมแรกกระตุก) ไดรเวอร์ควรทำการเริ่มต้นส่วนใหญ่ในระยะการคอมไพล์ การเริ่มต้นเมื่อดำเนินการครั้งแรกควรจำกัดไว้ที่การดำเนินการที่ส่งผลเสียต่อสถานะของระบบเมื่อดำเนินการก่อนเวลาอันควร เช่น การจองบัฟเฟอร์ชั่วคราวขนาดใหญ่หรือการเพิ่มอัตราสัญญาณนาฬิกาของอุปกรณ์ ไดรเวอร์ที่เตรียมโมเดลพร้อมกันได้ในจำนวนจำกัดอาจต้องทำการเริ่มต้นเมื่อมีการเรียกใช้ครั้งแรก

ใน Android 10 ขึ้นไป ในกรณีที่มีการดำเนินการหลายครั้งด้วยโมเดลที่เตรียมไว้เดียวกันอย่างรวดเร็วต่อเนื่อง ไคลเอ็นต์อาจเลือกใช้ออบเจ็กต์การดำเนินการแบบกลุ่มเพื่อสื่อสารระหว่างกระบวนการของแอปและไดรเวอร์ ดูข้อมูลเพิ่มเติมได้ที่ การดำเนินการแบบกลุ่มและคิวข้อความที่รวดเร็ว

ไดรเวอร์สามารถเก็บบัฟเฟอร์ชั่วคราวหรือเพิ่มอัตราสัญญาณนาฬิกาเพื่อปรับปรุงประสิทธิภาพสำหรับการดำเนินการหลายรายการติดต่อกันอย่างรวดเร็ว เราขอแนะนำให้สร้าง Watchdog Thread เพื่อปล่อยทรัพยากรหากไม่มีการสร้างคำขอใหม่หลังจาก ระยะเวลาที่กำหนด

รูปร่างเอาต์พุต

สำหรับคำขอที่ตัวถูกดำเนินการเอาต์พุตอย่างน้อย 1 รายการไม่มีมิติข้อมูลทั้งหมด ที่ระบุไว้ ไดรเวอร์ต้องระบุรายการรูปร่างเอาต์พุตที่มี ข้อมูลมิติข้อมูลสำหรับตัวถูกดำเนินการเอาต์พุตแต่ละรายการหลังจากการดำเนินการ ดูข้อมูลเพิ่มเติมเกี่ยวกับมิติข้อมูลได้ที่ OutputShape

หากการดำเนินการล้มเหลวเนื่องจากบัฟเฟอร์เอาต์พุตมีขนาดเล็กเกินไป ไดรเวอร์ต้อง ระบุตัวถูกดำเนินการเอาต์พุตที่มีขนาดบัฟเฟอร์ไม่เพียงพอในรายการ รูปร่างเอาต์พุต และควรรายงานข้อมูลมิติให้มากที่สุด โดยใช้ 0 สำหรับมิติที่ไม่รู้จัก

ช่วงเวลา

ใน Android 10 แอปจะขอเวลาดำเนินการได้หากแอปได้ระบุอุปกรณ์เครื่องเดียวที่จะใช้ในระหว่างกระบวนการคอมไพล์ โปรดดูรายละเอียดที่MeasureTiming และการค้นหาและการกำหนดอุปกรณ์ ในกรณีนี้ ไดรเวอร์ NN HAL 1.2 ต้องวัดระยะเวลาการดำเนินการหรือรายงาน UINT64_MAX (เพื่อระบุว่าระยะเวลาไม่พร้อมใช้งาน) เมื่อดำเนินการตามคำขอ ไดรเวอร์ ควรลดการลงโทษด้านประสิทธิภาพที่เกิดจากการวัดระยะเวลาการดำเนินการ ให้เหลือน้อยที่สุด

ไดรเวอร์รายงานระยะเวลาต่อไปนี้เป็นไมโครวินาทีในโครงสร้าง Timing

เวลาในการดำเนินการบนอุปกรณ์: ไม่รวมเวลาในการดำเนินการใน ไดรเวอร์ซึ่งทำงานบนโปรเซสเซอร์โฮสต์
เวลาในการดำเนินการในไดรเวอร์: รวมถึงเวลาในการดำเนินการในอุปกรณ์

ระยะเวลาเหล่านี้ต้องรวมเวลาที่ระบบระงับการดำเนินการด้วย เช่น เมื่อมีการขัดจังหวะการดำเนินการด้วยงานอื่นๆ หรือเมื่อระบบรอให้ทรัพยากรพร้อมใช้งาน

เมื่อไม่ได้ขอให้ไดรเวอร์วัดระยะเวลาการดำเนินการ หรือเมื่อเกิดข้อผิดพลาดในการดำเนินการ ไดรเวอร์ต้องรายงานระยะเวลาเป็น UINT64_MAX แม้ว่าระบบจะขอให้ไดรเวอร์วัดระยะเวลาการดำเนินการ แต่ไดรเวอร์อาจรายงาน UINT64_MAX สำหรับเวลาในอุปกรณ์ เวลาในไดรเวอร์ หรือทั้ง 2 อย่างแทน เมื่อไดรเวอร์รายงานระยะเวลาทั้ง 2 รายการเป็นค่าอื่นที่ไม่ใช่ UINT64_MAX เวลาในการดำเนินการในไดรเวอร์ต้องเท่ากับหรือมากกว่าเวลาใน อุปกรณ์

การดำเนินการที่แยก

ใน Android 11 NNAPI อนุญาตให้การดำเนินการรอรายการแฮนเดิล sync_fence และอาจส่งคืนออบเจ็กต์ sync_fence ซึ่งจะมีการส่งสัญญาณเมื่อการดำเนินการเสร็จสมบูรณ์ ซึ่งจะช่วยลดค่าใช้จ่ายสำหรับโมเดลลำดับขนาดเล็กและกรณีการใช้งานการสตรีม การดำเนินการที่จำกัดยังช่วยให้ทำงานร่วมกับคอมโพเนนต์อื่นๆ ที่สามารถส่งสัญญาณหรือรอ sync_fence ได้อย่างมีประสิทธิภาพมากขึ้นด้วย ดูข้อมูลเพิ่มเติมเกี่ยวกับ sync_fence ได้ที่เฟรมเวิร์กการซิงค์

ในการดำเนินการที่จำกัด เฟรมเวิร์กจะเรียกใช้เมธอด IPreparedModel::executeFenced เพื่อเปิดใช้การดำเนินการแบบอะซิงโครนัสที่จำกัดในโมเดลที่เตรียมไว้พร้อมเวกเตอร์ของรั้วการซิงค์เพื่อรอ หากงานแบบอะซิงโครนัสเสร็จสิ้นก่อนที่การเรียกจะกลับมา ระบบจะส่งคืนแฮนเดิลว่างสำหรับ sync_fence ได้ นอกจากนี้ ต้องส่งคืนออบเจ็กต์ IFencedExecutionCallback ด้วยเพื่อให้เฟรมเวิร์ก สามารถค้นหาสถานะข้อผิดพลาดและข้อมูลระยะเวลาได้

หลังจากดำเนินการเสร็จสมบูรณ์แล้ว คุณจะค้นหาค่าเวลา 2 ค่าต่อไปนี้ ซึ่งวัดระยะเวลาของการดำเนินการได้ผ่าน IFencedExecutionCallback::getExecutionInfo

timingLaunched: ระยะเวลาตั้งแต่เรียกใช้ executeFenced จนถึงเวลาที่ executeFenced ส่งสัญญาณ syncFence ที่ส่งคืน
timingFenced: ระยะเวลาตั้งแต่เมื่อมีการส่งสัญญาณรั้วการซิงค์ทั้งหมด ที่การดำเนินการรอจนถึงเมื่อ executeFenced ส่งสัญญาณ syncFence ที่ส่งคืน

ควบคุมโฟลว์

สำหรับอุปกรณ์ที่ใช้ Android 11 ขึ้นไป NNAPI มีการดำเนินการควบคุมโฟลว์ 2 รายการ ได้แก่ IF และ WHILE ซึ่งรับโมเดลอื่นๆ เป็นอาร์กิวเมนต์และดำเนินการตามเงื่อนไข (IF) หรือซ้ำๆ (WHILE) ดูข้อมูลเพิ่มเติมเกี่ยวกับวิธีใช้การดำเนินการนี้ได้ที่การควบคุมโฟลว์

คุณภาพของการบริการ

ใน Android 11 NNAPI มีคุณภาพของ บริการ (QoS) ที่ได้รับการปรับปรุงโดยอนุญาตให้แอประบุลำดับความสำคัญที่เกี่ยวข้องของ โมเดล ระยะเวลาสูงสุดที่คาดว่าจะใช้ในการเตรียมโมเดล และ ระยะเวลาสูงสุดที่คาดว่าจะใช้ในการดำเนินการให้เสร็จสมบูรณ์ ดูข้อมูลเพิ่มเติมได้ที่คุณภาพของบริการ

ล้างข้อมูล

เมื่อแอปใช้โมเดลที่เตรียมไว้เสร็จแล้ว เฟรมเวิร์กจะปล่อยการอ้างอิงไปยังออบเจ็กต์ @1.3::IPreparedModel เมื่อไม่มีการอ้างอิงออบเจ็กต์ IPreparedModel อีกต่อไป ระบบจะทำลายออบเจ็กต์โดยอัตโนมัติในบริการไดรเวอร์ที่สร้างออบเจ็กต์ คุณสามารถเรียกคืนทรัพยากรเฉพาะรุ่นได้ในขณะนี้ในการติดตั้งใช้งานตัวทำลายของไดรเวอร์ หากบริการไดรเวอร์ต้องการให้ระบบทำลายออบเจ็กต์ IPreparedModel โดยอัตโนมัติเมื่อไคลเอ็นต์ไม่ต้องการอีกต่อไป บริการนั้นต้องไม่เก็บการอ้างอิงใดๆ ไปยังออบเจ็กต์ IPreparedModel หลังจากที่ส่งคืนออบเจ็กต์ IPreparedeModel ผ่าน IPreparedModelCallback::notify_1_3 แล้ว

การใช้งาน CPU

คาดว่าไดรเวอร์จะใช้ CPU เพื่อตั้งค่าการคำนวณ ไดรเวอร์ไม่ควรใช้ CPU เพื่อทำการคำนวณกราฟเนื่องจากจะรบกวนความสามารถของเฟรมเวิร์กในการจัดสรรงานอย่างถูกต้อง ไดรเวอร์ควรรายงานส่วนที่จัดการไม่ได้ไปยังเฟรมเวิร์ก และปล่อยให้เฟรมเวิร์กจัดการส่วนที่เหลือ

เฟรมเวิร์กมีการใช้งาน CPU สำหรับการดำเนินการ NNAPI ทั้งหมดยกเว้น การดำเนินการที่ผู้ให้บริการกำหนด ดูข้อมูลเพิ่มเติมได้ที่ ส่วนขยายของผู้ให้บริการ

การดำเนินการที่เปิดตัวใน Android 10 (ระดับ API 29) มีเพียงการติดตั้งใช้งาน CPU อ้างอิงเพื่อยืนยันว่าการทดสอบ CTS และ VTS ถูกต้อง เราขอแนะนำให้ใช้การติดตั้งใช้งานที่เพิ่มประสิทธิภาพซึ่งรวมอยู่ในเฟรมเวิร์กแมชชีนเลิร์นนิงบนอุปกรณ์เคลื่อนที่มากกว่าการติดตั้งใช้งาน CPU ของ NNAPI

ฟังก์ชันยูทิลิตี

ฐานของโค้ด NNAPI มีฟังก์ชันยูทิลิตีที่บริการไดรเวอร์ใช้ได้

ไฟล์ frameworks/ml/nn/common/include/Utils.h มีฟังก์ชันยูทิลิตีต่างๆ เช่น ฟังก์ชันที่ใช้สำหรับการบันทึกและ สำหรับการแปลงระหว่าง NN HAL เวอร์ชันต่างๆ

VLogging: VLOG คือมาโคร Wrapper รอบ LOG ของ Android ซึ่งจะบันทึกข้อความก็ต่อเมื่อมีการตั้งค่าแท็กที่เหมาะสมในพร็อพเพอร์ตี้ debug.nn.vlog ต้องเรียกใช้ initVLogMask() ก่อนที่จะเรียกใช้ VLOG มาโคร VLOG_IS_ON สามารถใช้เพื่อตรวจสอบว่าขณะนี้ได้เปิดใช้ VLOG หรือไม่ ซึ่งจะช่วยให้ข้ามโค้ดการบันทึกที่ซับซ้อนได้หากไม่จำเป็น ค่าของพร็อพเพอร์ตี้ต้องเป็นค่าใดค่าหนึ่งต่อไปนี้
- สตริงว่าง ซึ่งบ่งบอกว่าไม่ต้องทำการบันทึก
- โทเค็น 1 หรือ all ซึ่งระบุว่าต้องทำการบันทึกทั้งหมด
- รายการแท็กที่คั่นด้วยช่องว่าง คอมมา หรือโคลอน ซึ่งระบุว่าควรบันทึกข้อมูลใด แท็กคือ compilation, cpuexe, driver, execution, manager และ model
compliantWithV1_*: แสดงผล true หากแปลงออบเจ็กต์ NN HAL เป็น HAL เวอร์ชันอื่นประเภทเดียวกันได้โดยไม่สูญเสียข้อมูล ตัวอย่างเช่น การเรียกใช้ compliantWithV1_0 ใน V1_2::Model จะแสดงผล false หากโมเดลมีประเภทการดำเนินการที่เปิดตัวใน NN HAL 1.1 หรือ NN HAL 1.2
convertToV1_*: แปลงออบเจ็กต์ NN HAL จากเวอร์ชันหนึ่งเป็นอีกเวอร์ชันหนึ่ง ระบบจะบันทึกคำเตือนหากผลลัพธ์ของ Conversion ทำให้ข้อมูลสูญหาย (กล่าวคือ หากประเภทเวอร์ชันใหม่ไม่สามารถแสดงค่าได้อย่างสมบูรณ์)
ความสามารถ: คุณสามารถใช้ฟังก์ชัน nonExtensionOperandPerformance และ update เพื่อช่วยสร้างฟิลด์ Capabilities::operandPerformance ได้
การค้นหาพร็อพเพอร์ตี้ของประเภท isExtensionOperandType isExtensionOperationType nonExtensionSizeOfData nonExtensionOperandSizeOfData nonExtensionOperandTypeIsScalar tensorHasUnspecifiedDimensions

ไฟล์ frameworks/ml/nn/common/include/ValidateHal.h มีฟังก์ชันยูทิลิตีสำหรับการตรวจสอบว่าออบเจ็กต์ NN HAL ถูกต้อง ตามข้อกำหนดของ HAL เวอร์ชันนั้นๆ

validate*: แสดงผล true หากออบเจ็กต์ NN HAL ใช้ได้ ตามข้อกำหนดของเวอร์ชัน HAL ระบบจะไม่ตรวจสอบประเภท OEM และประเภทส่วนขยาย เช่น validateModel จะแสดงผล false หากโมเดลมี การดำเนินการที่อ้างอิงดัชนีตัวถูกดำเนินการที่ไม่มีอยู่ หรือการดำเนินการที่ไม่รองรับใน HAL เวอร์ชันนั้น

ไฟล์ frameworks/ml/nn/common/include/Tracing.h มีมาโครเพื่อลดความซับซ้อนในการเพิ่มข้อมูล systracing ลงในโค้ดของ Neural Networks ตัวอย่างเช่น ดูการเรียกใช้มาโคร NNTRACE_* ในไดรเวอร์ตัวอย่าง

ไฟล์ frameworks/ml/nn/common/include/GraphDump.h มีฟังก์ชันยูทิลิตีเพื่อส่งออกเนื้อหาของ Model ในรูปแบบกราฟิก เพื่อวัตถุประสงค์ในการแก้ไขข้อบกพร่อง

graphDump: เขียนการแสดงโมเดลในรูปแบบ Graphviz (.dot) ไปยังสตรีมที่ระบุ (หากระบุ) หรือไปยัง Logcat (หากไม่ได้ระบุสตรีม)

การตรวจสอบ

หากต้องการทดสอบการใช้งาน NNAPI ให้ใช้การทดสอบ VTS และ CTS ที่รวมอยู่ใน เฟรมเวิร์ก Android VTS จะทดสอบไดรเวอร์โดยตรง (โดยไม่ใช้ เฟรมเวิร์ก) ในขณะที่ CTS จะทดสอบไดรเวอร์โดยอ้อมผ่านเฟรมเวิร์ก ซึ่งจะ ทดสอบแต่ละเมธอดของ API และยืนยันว่าการดำเนินการทั้งหมดที่ไดรเวอร์ รองรับทำงานได้อย่างถูกต้องและให้ผลลัพธ์ที่เป็นไปตามข้อกำหนดด้านความแม่นยำ

ข้อกำหนดด้านความแม่นยำใน CTS และ VTS สำหรับ NNAPI มีดังนี้

จุดลอยตัว: abs(expected - actual) <= atol + rtol * abs(expected); โดยที่
- สำหรับ fp32, atol = 1e-5f, rtol = 5.0f * 1.1920928955078125e-7
- สำหรับ fp16 atol = rtol = 5.0f * 0.0009765625f
ควอนไทซ์: คลาดเคลื่อน 1 (ยกเว้น mobilenet_quantized, ซึ่งคลาดเคลื่อน 3)
บูลีน: การทำงานแบบตรงทั้งหมด

วิธีหนึ่งที่ CTS ใช้ทดสอบ NNAPI คือการสร้างกราฟแบบสุ่มเทียมที่กำหนดไว้ ซึ่งใช้เพื่อทดสอบและเปรียบเทียบผลการดำเนินการจากไดรเวอร์แต่ละตัวกับการ ใช้งานอ้างอิงของ NNAPI สำหรับไดรเวอร์ที่มี NN HAL 1.2 ขึ้นไป หากผลลัพธ์ไม่เป็นไปตามเกณฑ์ความแม่นยำ CTS จะรายงานข้อผิดพลาดและทิ้งไฟล์ข้อมูลจำเพาะสำหรับโมเดลที่ไม่สำเร็จไว้ใน /data/local/tmp เพื่อการแก้ไขข้อบกพร่อง ดูรายละเอียดเพิ่มเติมเกี่ยวกับเกณฑ์ความแม่นยำได้ที่ TestRandomGraph.cpp และ TestHarness.h

การทดสอบแบบฟัซ

วัตถุประสงค์ของการทดสอบแบบฟัซคือการค้นหาข้อขัดข้อง การยืนยัน การละเมิดหน่วยความจำ หรือลักษณะการทำงานทั่วไปที่ไม่ได้กำหนดไว้ในโค้ดที่อยู่ระหว่างการทดสอบเนื่องจากปัจจัยต่างๆ เช่น อินพุตที่ไม่คาดคิด สำหรับการทดสอบแบบฟัซ NNAPI นั้น Android จะใช้การทดสอบที่อิงตาม libFuzzer ซึ่งมีประสิทธิภาพในการทดสอบแบบฟัซเนื่องจากใช้ความครอบคลุมของบรรทัดของกรณีทดสอบก่อนหน้าเพื่อสร้างอินพุตแบบสุ่มใหม่ เช่น libFuzzer จะให้ความสำคัญกับกรณีทดสอบที่ทำงาน ในโค้ดบรรทัดใหม่ ซึ่งจะช่วยลดเวลาที่ใช้ในการทดสอบเพื่อค้นหาโค้ดที่มีปัญหาได้อย่างมาก

หากต้องการทำการทดสอบแบบฟัซเพื่อตรวจสอบการใช้งานไดรเวอร์ ให้แก้ไข frameworks/ml/nn/runtime/test/android_fuzzing/DriverFuzzTest.cpp ในเครื่องมือทดสอบlibneuralnetworks_driver_fuzzerที่พบใน AOSP เพื่อรวม โค้ดไดรเวอร์ ดูข้อมูลเพิ่มเติมเกี่ยวกับการทดสอบแบบฟัซ NNAPI ได้ที่ frameworks/ml/nn/runtime/test/android_fuzzing/README.md

ความปลอดภัย

เนื่องจากกระบวนการของแอปสื่อสารกับกระบวนการของผู้ขับขี่โดยตรง ผู้ขับขี่จึงต้องตรวจสอบอาร์กิวเมนต์ของการเรียกที่ได้รับ การตรวจสอบนี้ ได้รับการยืนยันโดย VTS รหัสการตรวจสอบอยู่ใน frameworks/ml/nn/common/include/ValidateHal.h

นอกจากนี้ คนขับยังควรตรวจสอบว่าแอปไม่สามารถรบกวนแอปอื่นๆ เมื่อใช้อุปกรณ์เดียวกัน

ชุดทดสอบแมชชีนเลิร์นนิงของ Android

ชุดทดสอบแมชชีนเลิร์นนิง (MLTS) ของ Android เป็นการทดสอบประสิทธิภาพ NNAPI ที่รวมอยู่ใน CTS และ VTS เพื่อตรวจสอบความถูกต้องของโมเดลจริงในอุปกรณ์ของผู้ให้บริการ การทดสอบประสิทธิภาพจะประเมินเวลาในการตอบสนองและความแม่นยำ และเปรียบเทียบผลลัพธ์ของไดรเวอร์กับ ผลลัพธ์ที่ใช้ TF Lite ที่ทำงานบน CPU สำหรับโมเดลและชุดข้อมูลเดียวกัน วิธีนี้ช่วยให้มั่นใจว่าความแม่นยำของไดรเวอร์จะไม่แย่กว่าการใช้งานอ้างอิงของ CPU

นักพัฒนาแพลตฟอร์ม Android ยังใช้ MLTS เพื่อประเมินเวลาในการตอบสนองและความแม่นยำ ของไดรเวอร์ด้วย

คุณจะพบการเปรียบเทียบ NNAPI ได้ใน 2 โปรเจ็กต์ใน AOSP ดังนี้

platform/test/mlts/benchmark (แอปทดสอบประสิทธิภาพ)
platform/test/mlts/models (โมเดลและชุดข้อมูล)

โมเดลและชุดข้อมูล

การเปรียบเทียบ NNAPI ใช้โมเดลและชุดข้อมูลต่อไปนี้

MobileNetV1 แบบ Float และ u8 ที่มีการวัดปริมาณในขนาดต่างๆ ทำงานกับชุดข้อมูลย่อยขนาดเล็ก (รูปภาพ 1, 500 รูป) ของชุดข้อมูล Open Images เวอร์ชัน 4
MobileNetV2 แบบ Float และแบบ Quantized u8 ในขนาดต่างๆ ทำงานกับชุดข้อมูลย่อยขนาดเล็ก (รูปภาพ 1, 500 รูป) ของชุดข้อมูล Open Images v4
โมเดลเสียงที่อิงตามหน่วยความจำระยะสั้นแบบยาว (LSTM) สำหรับการแปลงข้อความเป็นคำพูด ทำงานกับชุดข้อมูล CMU Arctic กลุ่มย่อยขนาดเล็ก
โมเดลเสียงที่อิงตาม LSTM สำหรับการรู้จำคำพูดอัตโนมัติ ซึ่งทำงานกับ ชุดข้อมูล LibriSpeech ที่เป็นชุดย่อยขนาดเล็ก

ดูข้อมูลเพิ่มเติมได้ที่ platform/test/mlts/models

การทดสอบประสิทธิภาพ

ชุดทดสอบแมชชีนเลิร์นนิงของ Android มีการทดสอบการขัดข้องหลายชุดเพื่อ ตรวจสอบความยืดหยุ่นของไดรเวอร์ภายใต้สภาวะการใช้งานหนักหรือในกรณีที่ พฤติกรรมของไคลเอ็นต์มีความเฉพาะเจาะจง

การทดสอบการหยุดทำงานทั้งหมดมีฟีเจอร์ต่อไปนี้

การตรวจหาการแฮงก์: หากไคลเอ็นต์ NNAPI แฮงก์ระหว่างการทดสอบ การทดสอบจะล้มเหลวโดยมีสาเหตุที่ทำให้ล้มเหลวเป็น HANG และชุดโปรแกรมทดสอบจะย้ายไปที่การทดสอบถัดไป
การตรวจหาการขัดข้องของไคลเอ็นต์ NNAPI: การทดสอบจะยังคงทำงานได้แม้ว่าไคลเอ็นต์จะขัดข้อง และการทดสอบจะล้มเหลวพร้อมเหตุผลที่ทำให้ล้มเหลว CRASH
การตรวจจับไดรเวอร์ขัดข้อง: การทดสอบสามารถตรวจจับไดรเวอร์ขัดข้อง ที่ทำให้การเรียก NNAPI ล้มเหลวได้ โปรดทราบว่าอาจเกิดข้อขัดข้องในกระบวนการของไดรเวอร์ซึ่งไม่ทำให้ NNAPI ล้มเหลวและไม่ทำให้การทดสอบล้มเหลว เราขอแนะนําให้เรียกใช้คําสั่ง tail ในบันทึกของระบบเพื่อดูข้อผิดพลาดหรือข้อขัดข้องที่เกี่ยวข้องกับไดรเวอร์ เพื่อรับมือกับความล้มเหลวประเภทนี้
การกำหนดเป้าหมายของ Accelerator ที่พร้อมใช้งานทั้งหมด: การทดสอบจะดำเนินการกับไดรเวอร์ที่พร้อมใช้งานทั้งหมด

การทดสอบการหยุดทำงานทั้งหมดมีผลลัพธ์ที่เป็นไปได้ 4 อย่างดังนี้

SUCCESS: ดำเนินการเสร็จสมบูรณ์โดยไม่มีข้อผิดพลาด
FAILURE: ดำเนินการไม่สำเร็จ โดยปกติเกิดจากความล้มเหลวเมื่อ ทดสอบโมเดล ซึ่งบ่งชี้ว่าไดรเวอร์คอมไพล์หรือเรียกใช้ โมเดลไม่สำเร็จ
HANG: กระบวนการทดสอบไม่ตอบสนอง
CRASH: กระบวนการทดสอบขัดข้อง

ดูข้อมูลเพิ่มเติมเกี่ยวกับการทดสอบความเครียดและรายการการทดสอบการหยุดทำงานทั้งหมดได้ที่ platform/test/mlts/benchmark/README.txt

ใช้ MLTS

วิธีใช้ MLTS

เชื่อมต่ออุปกรณ์เป้าหมายกับเวิร์กสเตชันและตรวจสอบว่าเข้าถึงได้ผ่าน adb ส่งออกตัวแปรสภาพแวดล้อม ANDROID_SERIAL ของอุปกรณ์เป้าหมายหากเชื่อมต่ออุปกรณ์มากกว่า 1 เครื่อง
cd ไปยังไดเรกทอรีต้นทางระดับบนสุดของ Android
```
source build/envsetup.sh
lunch aosp_arm-userdebug # Or aosp_arm64-userdebug if available.
./test/mlts/benchmark/build_and_run_benchmark.sh
```
เมื่อสิ้นสุดการทดสอบประสิทธิภาพ ระบบจะแสดงผลลัพธ์เป็นหน้า HTML และส่งไปยัง xdg-open

ดูข้อมูลเพิ่มเติมได้ที่ platform/test/mlts/benchmark/README.txt

เวอร์ชัน HAL ของโครงข่ายระบบประสาทเทียม

ส่วนนี้จะอธิบายการเปลี่ยนแปลงที่เกิดขึ้นใน Android และเวอร์ชัน HAL ของ Neural Networks

Android 11

Android 11 เปิดตัว NN HAL 1.3 ซึ่งมีการเปลี่ยนแปลงที่สำคัญต่อไปนี้

รองรับการหาปริมาณแบบ 8 บิตที่ลงนามใน NNAPI เพิ่มประเภทตัวถูกดำเนินการ TENSOR_QUANT8_ASYMM_SIGNED ไดรเวอร์ที่มี NN HAL 1.3 ที่รองรับ การดำเนินการที่มีการวัดปริมาณที่ไม่ได้ลงนามต้องรองรับตัวแปรที่มีการลงนาม ของการดำเนินการเหล่านั้นด้วย เมื่อเรียกใช้การดำเนินการเชิงปริมาณส่วนใหญ่ทั้งเวอร์ชันที่มีและไม่มีการลงนาม ไดรเวอร์ต้องสร้างผลลัพธ์เดียวกันโดยมีออฟเซ็ตไม่เกิน 128 ข้อกำหนดนี้มีข้อยกเว้น 5 ประการ ได้แก่ CAST, HASHTABLE_LOOKUP, LSH_PROJECTION, PAD_V2 และ QUANTIZED_16BIT_LSTM การดำเนินการ QUANTIZED_16BIT_LSTM ไม่รองรับตัวถูกดำเนินการที่มีการลงชื่อ และการดำเนินการอีก 4 รายการรองรับการหาปริมาณที่มีการลงชื่อ แต่ไม่จำเป็นต้องให้ผลลัพธ์เหมือนกัน
รองรับการดำเนินการที่จำกัดขอบเขตซึ่งเฟรมเวิร์กเรียกใช้เมธอด IPreparedModel::executeFenced เพื่อเปิดใช้การดำเนินการแบบอะซิงโครนัสที่จำกัดขอบเขตในโมเดลที่เตรียมไว้พร้อมกับ เวกเตอร์ของรั้วซิงค์เพื่อรอ ดูข้อมูลเพิ่มเติมได้ที่ การดำเนินการแบบจำกัด
การรองรับโฟลว์การควบคุม เพิ่มการดำเนินการ IF และ WHILE ซึ่งใช้โมเดลอื่นๆ เป็นอาร์กิวเมนต์และดำเนินการตามเงื่อนไข (IF) หรือซ้ำๆ (WHILE) ดูข้อมูลเพิ่มเติมได้ที่โฟลว์การควบคุม
คุณภาพของบริการ (QoS) ที่ดีขึ้นเนื่องจากแอปสามารถระบุลำดับความสำคัญที่เกี่ยวข้องของโมเดล เวลาสูงสุดที่คาดไว้ในการเตรียมโมเดล และเวลาสูงสุดที่คาดไว้ในการดำเนินการให้เสร็จสมบูรณ์ ดูข้อมูลเพิ่มเติมได้ที่ คุณภาพของบริการ
รองรับโดเมนหน่วยความจำที่ให้อินเทอร์เฟซตัวจัดสรรสำหรับบัฟเฟอร์ที่ไดรเวอร์จัดการ ซึ่งช่วยให้ส่งหน่วยความจำดั้งเดิมของอุปกรณ์ ในการดำเนินการต่างๆ ได้ โดยจะระงับการคัดลอกและการแปลงข้อมูลที่ไม่จำเป็น ระหว่างการดำเนินการที่ต่อเนื่องกันในไดรเวอร์เดียวกัน ดูข้อมูลเพิ่มเติมได้ที่โดเมนหน่วยความจำ

Android 10

Android 10 เปิดตัว NN HAL 1.2 ซึ่งมีการเปลี่ยนแปลงที่สำคัญต่อไปนี้

Capabilities struct มีประเภทข้อมูลทั้งหมด รวมถึงประเภทข้อมูลสเกลาร์ และแสดงประสิทธิภาพที่ไม่ผ่อนคลายโดยใช้เวกเตอร์แทน ฟิลด์ที่มีชื่อ
เมธอด getVersionString และ getType ช่วยให้เฟรมเวิร์ก เรียกข้อมูลประเภทอุปกรณ์ (DeviceType) และเวอร์ชันได้ ดูการค้นหาและการกำหนดอุปกรณ์
ระบบจะเรียกใช้เมธอด executeSynchronously โดยค่าเริ่มต้นเพื่อดำเนินการ แบบพร้อมกัน เมธอด execute_1_2 จะบอกให้เฟรมเวิร์ก ดำเนินการแบบไม่พร้อมกัน ดูการดำเนินการ
พารามิเตอร์ MeasureTiming สำหรับ executeSynchronously, execute_1_2 และการดำเนินการแบบกลุ่มจะระบุว่าไดรเวอร์ควรวัดระยะเวลาการดำเนินการหรือไม่ ระบบจะรายงานผลลัพธ์ในTiming ดูช่วงเวลา
รองรับการดำเนินการที่ตัวถูกดำเนินการเอาต์พุตอย่างน้อย 1 รายการมีมิติข้อมูลหรืออันดับที่ไม่รู้จัก ดูรูปร่างเอาต์พุต
การรองรับส่วนขยายของผู้ให้บริการ ซึ่งเป็นคอลเล็กชันของ การดำเนินการและประเภทข้อมูลที่ผู้ให้บริการกำหนด ไดรเวอร์รายงานส่วนขยายที่รองรับผ่านเมธอด IDevice::getSupportedExtensions ดูส่วนขยายของผู้ให้บริการ
ความสามารถของออบเจ็กต์การประมวลผลแบบกลุ่มในการควบคุมชุดการดำเนินการประมวลผลแบบกลุ่มโดยใช้ คิวข้อความที่รวดเร็ว (FMQ) เพื่อสื่อสารระหว่างแอปและไดรเวอร์ ลดเวลาในการตอบสนอง ดูการดำเนินการแบบกลุ่มและคิวข้อความที่รวดเร็ว
รองรับ AHardwareBuffer เพื่อให้ไดรเวอร์ดำเนินการได้ โดยไม่ต้องคัดลอกข้อมูล ดู AHardwareBuffer
ปรับปรุงการรองรับการแคชอาร์ติแฟกต์การคอมไพล์เพื่อลดเวลาที่ใช้ในการคอมไพล์เมื่อแอปเริ่มต้น ดู การแคชการคอมไพล์

Android 10 มีตัวถูกดำเนินการและ การดำเนินการต่อไปนี้

ประเภทตัวถูกดำเนินการ
- ANEURALNETWORKS_BOOL
- ANEURALNETWORKS_FLOAT16
- ANEURALNETWORKS_TENSOR_BOOL8
- ANEURALNETWORKS_TENSOR_FLOAT16
- ANEURALNETWORKS_TENSOR_QUANT16_ASYMM
- ANEURALNETWORKS_TENSOR_QUANT16_SYMM
- ANEURALNETWORKS_TENSOR_QUANT8_SYMM
- ANEURALNETWORKS_TENSOR_QUANT8_SYMM_PER_CHANNEL
ปฏิบัติการ
- ANEURALNETWORKS_ABS
- ANEURALNETWORKS_ARGMAX
- ANEURALNETWORKS_ARGMIN
- ANEURALNETWORKS_AXIS_ALIGNED_BBOX_TRANSFORM
- ANEURALNETWORKS_BIDIRECTIONAL_SEQUENCE_LSTM
- ANEURALNETWORKS_BIDIRECTIONAL_SEQUENCE_RNN
- ANEURALNETWORKS_BOX_WITH_NMS_LIMIT
- ANEURALNETWORKS_CAST
- ANEURALNETWORKS_CHANNEL_SHUFFLE
- ANEURALNETWORKS_DETECTION_POSTPROCESSING
- ANEURALNETWORKS_EQUAL
- ANEURALNETWORKS_EXP
- ANEURALNETWORKS_EXPAND_DIMS
- ANEURALNETWORKS_GATHER
- ANEURALNETWORKS_GENERATE_PROPOSALS
- ANEURALNETWORKS_GREATER
- ANEURALNETWORKS_GREATER_EQUAL
- ANEURALNETWORKS_GROUPED_CONV_2D
- ANEURALNETWORKS_HEATMAP_MAX_KEYPOINT
- ANEURALNETWORKS_INSTANCE_NORMALIZATION
- ANEURALNETWORKS_LESS
- ANEURALNETWORKS_LESS_EQUAL
- ANEURALNETWORKS_LOG
- ANEURALNETWORKS_LOGICAL_AND
- ANEURALNETWORKS_LOGICAL_NOT
- ANEURALNETWORKS_LOGICAL_OR
- ANEURALNETWORKS_LOG_SOFTMAX
- ANEURALNETWORKS_MAXIMUM
- ANEURALNETWORKS_MINIMUM
- ANEURALNETWORKS_NEG
- ANEURALNETWORKS_NOT_EQUAL
- ANEURALNETWORKS_PAD_V2
- ANEURALNETWORKS_POW
- ANEURALNETWORKS_PRELU
- ANEURALNETWORKS_QUANTIZE
- ANEURALNETWORKS_QUANTIZED_16BIT_LSTM
- ANEURALNETWORKS_RANDOM_MULTINOMIAL
- ANEURALNETWORKS_REDUCE_ALL
- ANEURALNETWORKS_REDUCE_ANY
- ANEURALNETWORKS_REDUCE_MAX
- ANEURALNETWORKS_REDUCE_MIN
- ANEURALNETWORKS_REDUCE_PROD
- ANEURALNETWORKS_REDUCE_SUM
- ANEURALNETWORKS_RESIZE_NEAREST_NEIGHBOR
- ANEURALNETWORKS_ROI_ALIGN
- ANEURALNETWORKS_ROI_POOLING
- ANEURALNETWORKS_RSQRT
- ANEURALNETWORKS_SELECT
- ANEURALNETWORKS_SIN
- ANEURALNETWORKS_SLICE
- ANEURALNETWORKS_SPLIT
- ANEURALNETWORKS_SQRT
- ANEURALNETWORKS_TILE
- ANEURALNETWORKS_TOPK_V2
- ANEURALNETWORKS_TRANSPOSE_CONV_2D
- ANEURALNETWORKS_UNIDIRECTIONAL_SEQUENCE_LSTM
- ANEURALNETWORKS_UNIDIRECTIONAL_SEQUENCE_RNN

Android 10 เปิดตัวการอัปเดตการดำเนินการที่มีอยู่หลายอย่าง การอัปเดตส่วนใหญ่เกี่ยวข้องกับสิ่งต่อไปนี้

รองรับเลย์เอาต์หน่วยความจำ NCHW
รองรับเทนเซอร์ที่มีอันดับต่างจาก 4 ในการดำเนินการ Softmax และ การดำเนินการ Normalization
รองรับการบิดเบือน
รองรับอินพุตที่มีการหาปริมาณแบบผสมใน ANEURALNETWORKS_CONCATENATION

รายการด้านล่างแสดงการดำเนินการที่ได้รับการแก้ไขใน Android 10 ดูรายละเอียดทั้งหมดของการเปลี่ยนแปลงได้ที่ OperationCode ในเอกสารอ้างอิง NNAPI

ANEURALNETWORKS_ADD
ANEURALNETWORKS_AVERAGE_POOL_2D
ANEURALNETWORKS_BATCH_TO_SPACE_ND
ANEURALNETWORKS_CONCATENATION
ANEURALNETWORKS_CONV_2D
ANEURALNETWORKS_DEPTHWISE_CONV_2D
ANEURALNETWORKS_DEPTH_TO_SPACE
ANEURALNETWORKS_DEQUANTIZE
ANEURALNETWORKS_DIV
ANEURALNETWORKS_FLOOR
ANEURALNETWORKS_FULLY_CONNECTED
ANEURALNETWORKS_L2_NORMALIZATION
ANEURALNETWORKS_L2_POOL_2D
ANEURALNETWORKS_LOCAL_RESPONSE_NORMALIZATION
ANEURALNETWORKS_LOGISTIC
ANEURALNETWORKS_LSH_PROJECTION
ANEURALNETWORKS_LSTM
ANEURALNETWORKS_MAX_POOL_2D
ANEURALNETWORKS_MEAN
ANEURALNETWORKS_MUL
ANEURALNETWORKS_PAD
ANEURALNETWORKS_RELU
ANEURALNETWORKS_RELU1
ANEURALNETWORKS_RELU6
ANEURALNETWORKS_RESHAPE
ANEURALNETWORKS_RESIZE_BILINEAR
ANEURALNETWORKS_RNN
ANEURALNETWORKS_ROI_ALIGN
ANEURALNETWORKS_SOFTMAX
ANEURALNETWORKS_SPACE_TO_BATCH_ND
ANEURALNETWORKS_SPACE_TO_DEPTH
ANEURALNETWORKS_SQUEEZE
ANEURALNETWORKS_STRIDED_SLICE
ANEURALNETWORKS_SUB
ANEURALNETWORKS_SVDF
ANEURALNETWORKS_TANH
ANEURALNETWORKS_TRANSPOSE

Android 9

NN HAL 1.1 เปิดตัวใน Android 9 และมีการเปลี่ยนแปลงที่สำคัญต่อไปนี้

IDevice::prepareModel_1_1 มีพารามิเตอร์ ExecutionPreference ไดรเวอร์สามารถใช้พารามิเตอร์นี้เพื่อปรับการเตรียมการ โดยทราบว่า แอปต้องการประหยัดแบตเตอรี่หรือจะเรียกใช้โมเดล ในการเรียกที่ต่อเนื่องกันอย่างรวดเร็ว
เราได้เพิ่มการดำเนินการใหม่ 9 รายการ ได้แก่ BATCH_TO_SPACE_ND, DIV, MEAN, PAD, SPACE_TO_BATCH_ND, SQUEEZE, STRIDED_SLICE, SUB, TRANSPOSE
แอปสามารถระบุว่าการคำนวณแบบ Float 32 บิตสามารถเรียกใช้ได้ โดยใช้ช่วงและ/หรือความแม่นยำของ Float 16 บิตโดยการตั้งค่า Model.relaxComputationFloat32toFloat16 เป็น true Capabilities struct มีฟิลด์เพิ่มเติม relaxedFloat32toFloat16Performance เพื่อ ให้ไดรเวอร์รายงานประสิทธิภาพที่ผ่อนคลายแล้วไปยังเฟรมเวิร์กได้

Android 8.1

HAL ของโครงข่ายประสาทเทียม (1.0) เวอร์ชันแรกเปิดตัวใน Android 8.1 ดูข้อมูลเพิ่มเติมได้ที่ /neuralnetworks/1.0/