कोड 9 (SEGV_MTESERR) या कोड 8 (SEGV_MTEAERR) के साथ SIGSEGV के क्रैश होने पर मेमोरी टैगिंग से जुड़ी गड़बड़ियां होती हैं. मेमोरी टैगिंग एक्सटेंशन (एमटीई) Armv9 सुविधा, Android 12 और उसके बाद के वर्शन पर काम करती है. एमटीई, टैग किए गए कोड का हार्डवेयर लागू करने का तरीका है मेमोरी. यह नई समस्याओं का पता लगाने और उन्हें कम करने के लिए, छोटी मेमोरी वाली सुरक्षा देता है मेमोरी की सुरक्षा से जुड़ी गड़बड़ियां शामिल हैं.
C/C++ में, कॉल से Maloc() या ऑपरेटर new() या मिलते-जुलते फ़ंक्शन पर लौटाए गए पॉइंटर उसका इस्तेमाल सिर्फ़ उस ऐलोकेशन की सीमाओं के अंदर मेमोरी को ऐक्सेस करने के लिए किया जाना चाहिए. साथ ही, असाइन किया गया डेटा उपलब्ध हो (बिना शुल्क वाला या मिटाया गया नहीं). Android में MTE का इस्तेमाल, इन नीतियों के उल्लंघन का पता लगाने के लिए किया जाता है क्रैश रिपोर्ट में इसे "बफ़र ओवरफ़्लो"/"बफ़र अंडरफ़्लो" कहा जाता है और "बिना किसी शुल्क के इस्तेमाल करें" समस्याएं.
MTE के दो मोड हैं: सिंक्रोनस (या "सिंक") और एसिंक्रोनस (या "एसिंक्रोनस") मोड. पहले की दौड़ ज़्यादा होती है से पता चलता है. हालांकि, यह ज़्यादा सटीक डाइग्नोस्टिक्स देता है. बाद वाला मॉडल तेज़ी से काम करता है, लेकिन यह सिर्फ़ में पूरी जानकारी दी होती है. हम दोनों के बारे में अलग-अलग जानकारी देंगे, क्योंकि डाइग्नोस्टिक्स के नतीजे थोड़े अलग होते हैं.
सिंक्रोनस मोड MTE
MTE के सिंक्रोनस ("सिंक") मोड में, SIGSEGV कोड 9 (SEGV_MTESERR) के साथ क्रैश हो जाता है.
pid: 13935, tid: 13935, name: sanitizer-statu >>> sanitizer-status <<< uid: 0 tagged_addr_ctrl: 000000000007fff3 signal 11 (SIGSEGV), code 9 (SEGV_MTESERR), fault addr 0x800007ae92853a0 Cause: [MTE]: Use After Free, 0 bytes into a 32-byte allocation at 0x7ae92853a0 x0 0000007cd94227cc x1 0000007cd94227cc x2 ffffffffffffffd0 x3 0000007fe81919c0 x4 0000007fe8191a10 x5 0000000000000004 x6 0000005400000051 x7 0000008700000021 x8 0800007ae92853a0 x9 0000000000000000 x10 0000007ae9285000 x11 0000000000000030 x12 000000000000000d x13 0000007cd941c858 x14 0000000000000054 x15 0000000000000000 x16 0000007cd940c0c8 x17 0000007cd93a1030 x18 0000007cdcac6000 x19 0000007fe8191c78 x20 0000005800eee5c4 x21 0000007fe8191c90 x22 0000000000000002 x23 0000000000000000 x24 0000000000000000 x25 0000000000000000 x26 0000000000000000 x27 0000000000000000 x28 0000000000000000 x29 0000007fe8191b70 lr 0000005800eee0bc sp 0000007fe8191b60 pc 0000005800eee0c0 pst 0000000060001000 backtrace: #00 pc 00000000000010c0 /system/bin/sanitizer-status (test_crash_malloc_uaf()+40) (BuildId: 953fc93301472d0b72709b2b9a9f6f30) #01 pc 00000000000014a4 /system/bin/sanitizer-status (test(void (*)())+132) (BuildId: 953fc93301472d0b72709b2b9a9f6f30) #02 pc 00000000000019cc /system/bin/sanitizer-status (main+1032) (BuildId: 953fc93301472d0b72709b2b9a9f6f30) #03 pc 00000000000487d8 /apex/com.android.runtime/lib64/bionic/libc.so (__libc_init+96) (BuildId: 6ab39e35a2fae7efbe9a04e9bbb14331) deallocated by thread 13935: #00 pc 000000000004643c /apex/com.android.runtime/lib64/bionic/libc.so (scudo::Allocator<scudo::AndroidConfig, &(scudo_malloc_postinit)>::quarantineOrDeallocateChunk(scudo::Options, void*, scudo::Chunk::UnpackedHeader*, unsigned long)+688) (BuildId: 6ab39e35a2fae7efbe9a04e9bbb14331) #01 pc 00000000000421e4 /apex/com.android.runtime/lib64/bionic/libc.so (scudo::Allocator<scudo::AndroidConfig, &(scudo_malloc_postinit)>::deallocate(void*, scudo::Chunk::Origin, unsigned long, unsigned long)+212) (BuildId: 6ab39e35a2fae7efbe9a04e9bbb14331) #02 pc 00000000000010b8 /system/bin/sanitizer-status (test_crash_malloc_uaf()+32) (BuildId: 953fc93301472d0b72709b2b9a9f6f30) #03 pc 00000000000014a4 /system/bin/sanitizer-status (test(void (*)())+132) (BuildId: 953fc93301472d0b72709b2b9a9f6f30) allocated by thread 13935: #00 pc 0000000000042020 /apex/com.android.runtime/lib64/bionic/libc.so (scudo::Allocator<scudo::AndroidConfig, &(scudo_malloc_postinit)>::allocate(unsigned long, scudo::Chunk::Origin, unsigned long, bool)+1300) (BuildId: 6ab39e35a2fae7efbe9a04e9bbb14331) #01 pc 0000000000042394 /apex/com.android.runtime/lib64/bionic/libc.so (scudo_malloc+36) (BuildId: 6ab39e35a2fae7efbe9a04e9bbb14331) #02 pc 000000000003cc9c /apex/com.android.runtime/lib64/bionic/libc.so (malloc+36) (BuildId: 6ab39e35a2fae7efbe9a04e9bbb14331) #03 pc 00000000000010ac /system/bin/sanitizer-status (test_crash_malloc_uaf()+20) (BuildId: 953fc93301472d0b72709b2b9a9f6f30) #04 pc 00000000000014a4 /system/bin/sanitizer-status (test(void (*)())+132) (BuildId: 953fc93301472d0b72709b2b9a9f6f30)
सभी एमटीई क्रैश रिपोर्ट में उस पॉइंट के लिए सामान्य रजिस्टर डंप और बैकट्रेस होता है जहां समस्या का पता चला. "वजह:" MTE के ज़रिए पता लगाई गई गड़बड़ी की लाइन में "[MTE]" होगा इस तरह कृपया थोड़ा और विस्तार से बताएं. इस मामले में, जिस तरह की गड़बड़ी का पता चला था वह "मुफ़्त इस्तेमाल के बाद इस्तेमाल करें" और "0x7ae92853a0 पर 32-बाइट के ऐलोकेशन में 0 बाइट" हमें बताती है कि के साइज़ और पते की जानकारी देनी चाहिए. साथ ही, उस ऐलोकेशन में ऑफ़सेट भी है जिसे ऐक्सेस करने की हमने कोशिश की थी.
एमटीई की क्रैश रिपोर्ट में कई और बैकट्रेस भी शामिल होते हैं, न कि सिर्फ़ गड़बड़ी का पता चलने पर.
"बिना किसी शुल्क के इस्तेमाल करें" त्रुटियों में "इसके द्वारा विद्रोह हुआ" जोड़ा जाता है और "इन्होंने असाइन किया" सेक्शन, क्रैश डंप उस समय स्टैक ट्रेस दिखा रहा था जब यह मेमोरी असाइन की गई थी (इसका इस्तेमाल किए जाने से पहले!), और पहले तय किए गए समय में. इनसे आपको यह भी पता चलेगा कि किस थ्रेड ने असाइन करना/डिपेंडेंट करना. डिटेक्ट करने वाला थ्रेड, थ्रेड असाइन करने, और हटाने के तीनों विकल्प इस आसान उदाहरण में थ्रेड एक जैसे हैं. हालांकि, असल दुनिया के ज़्यादा जटिल मामलों में यह सही है, और यह जानना ज़रूरी है कि वे एक-दूसरे से किस तरह अलग हैं. यह एक साथ कई गड़बड़ी हो सकती हैं.
"बफ़र ओवरफ़्लो" और "बफ़र अंडरफ़्लो" त्रुटियां केवल तभी अतिरिक्त "इसके द्वारा आबंटित" की अनुमति नहीं है, क्योंकि परिभाषा के अनुसार उन्हें अभी तक हटाया नहीं गया है (या वे "बिना किसी शुल्क के इस्तेमाल करें"):
Cause: [MTE]: Buffer Overflow, 0 bytes right of a 32-byte allocation at 0x7ae92853a0 [...] backtrace: [...] allocated by thread 13949:अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है
"सही" शब्द के इस्तेमाल पर ध्यान दें यहां: इसका मतलब है कि हम आपको बता रहे हैं कि आखिर में कितने बाइट हुए गलत ऐक्सेस असाइन किया गया था; तो एक अंडरफ़्लो, "लेफ़्ट" के तौर पर दिखता है, और असाइन करने की प्रोसेस शुरू होने से पहले बाइट.
एक से ज़्यादा संभावित वजहें
कभी-कभी SEGV_MTESERR रिपोर्ट में यह पंक्ति होती है:
Note: multiple potential causes for this crash were detected, listing them in decreasing order of likelihood.
ऐसा तब होता है, जब गड़बड़ी के सोर्स के लिए कई अच्छे विकल्प मौजूद होते हैं और हम यह नहीं बता सकते यही असली वजह है. हम इस तरह के ज़्यादा से ज़्यादा तीन उम्मीदवारों को प्रिंट करते हैं. हम इनका प्रिंट देते हैं और विश्लेषण उपयोगकर्ता को छोड़ दें.
signal 11 (SIGSEGV), code 9 (SEGV_MTESERR), fault addr 0x400007b43063db5 backtrace: [stack...] Note: multiple potential causes for this crash were detected, listing them in decreasing order of probability. Cause: [MTE]: Use After Free, 5 bytes into a 10-byte allocation at 0x7b43063db0 deallocated by thread 6663: [stack...] allocated by thread 6663: [stack...] Cause: [MTE]: Use After Free, 5 bytes into a 6-byte allocation at 0x7b43063db0 deallocated by thread 6663: [stack...] allocated by thread 6663: [stack...]
ऊपर दिए गए उदाहरण में, हमें हाल ही में एक ही मेमोरी पते पर दो बार असाइन हुए हैं अमान्य मेमोरी ऐक्सेस का टारगेट तय किया गया हो. ऐसा तब हो सकता है, जब ऐलोकेशन का फिर से इस्तेमाल किया जाता है मुफ़्त मेमोरी - उदाहरण के लिए, अगर आपके पास ये क्रम हैं जैसे कि नया, मुफ़्त, नया, मुफ़्त, नया, मुफ़्त, ऐक्सेस दें. हाल ही में असाइन किए गए बजट सबसे पहले प्रिंट किए जाते हैं.
वजह का विस्तार से पता लगाने के अनुभव
"वजह" क्रैश के मामले में, उस मेमोरी ऐलोकेशन को दिखाना चाहिए जिससे ऐक्सेस किया गया पॉइंटर मिला था. माफ़ करें, एमटीई हार्डवेयर को ऐसे पॉइंटर से ऐलोकेशन में बदलने का कोई तरीका नहीं है जिसके साथ मैच नहीं करने वाले टैग शामिल हों. SEGV_MTESERR क्रैश की जानकारी देने के लिए, Android इस डेटा का विश्लेषण करता है:
- गड़बड़ी का पता (इसमें पॉइंटर टैग भी शामिल है).
- स्टैक ट्रेस और मेमोरी टैग के साथ, हाल ही में असाइन किए गए हीप की सूची.
- आस-पास के मौजूदा (लाइव) आवंटन और उनके मेमोरी टैग.
गड़बड़ी वाले पते पर, हाल ही में हटाई गई कोई भी मेमोरी जहां मेमोरी टैग, गड़बड़ी के पता टैग से मेल खाता है, उसे "मुफ़्त में इस्तेमाल करें" के तौर पर माना जाता है वजह.
आस-पास की ऐसी कोई भी लाइव मेमोरी जहां मेमोरी टैग, गड़बड़ी के पता टैग से मेल खाता है, वह संभावित "बफ़र ओवरफ़्लो" है (या "बफ़र अंडरफ़्लो") की समस्या हो सकती है.
तय समय में या स्पेस में होने वाली गड़बड़ियों को दूर करने वाले आवंटन के मुकाबले, उन बजट को ज़्यादा बेहतर माना जाता है जो गड़बड़ी के करीब होते हैं.
आम तौर पर, हटाई गई मेमोरी का अक्सर फिर से इस्तेमाल किया जाता है और टैग की अलग-अलग वैल्यू कम (16 से कम) होती हैं. इसलिए, कई संभावित उम्मीदवारों का मिलना और अपने-आप सही वजह का पता लगाने का कोई तरीका नहीं है. इसी वजह से, कभी-कभी एमटीई रिपोर्ट में कई संभावित वजहें शामिल होती हैं.
यह सुझाव दिया जाता है कि ऐप्लिकेशन डेवलपर सबसे संभावित वजहों से शुरू करके संभावित वजहों पर ध्यान दे. स्टैक ट्रेस की मदद से, ऐसी समस्याओं को आसानी से फ़िल्टर किया जा सकता है जो एक-दूसरे से मेल नहीं खातीं.
एसिंक्रोनस मोड MTE
MTE के एसिंक्रोनस ("एसिंक्रोनस") मोड में, कोड 8 (SEGV_MTEAERR) के साथ SIGSEGV क्रैश हो जाता है.
जब कोई प्रोग्राम अमान्य मेमोरी ऐक्सेस करता है, तो SEGV_MTEAERR की गड़बड़ियां तुरंत नहीं होती हैं. इवेंट के कुछ समय बाद ही इस समस्या का पता चलता है और इसके बजाय प्रोग्राम को उसी समय खत्म कर दिया जाता है. यह पॉइंट आम तौर पर अगला सिस्टम कॉल होता है, लेकिन यह टाइमर में रुकावट की वजह से भी हो सकता है - कम शब्दों में कहें, तो यूज़रस्पेस-टू-कर्नेल के बीच ट्रांज़िशन होना.
SEGV_MTEAERR की गड़बड़ियां मेमोरी के पते को सुरक्षित नहीं रखती हैं (इसे हमेशा "-------" के तौर पर दिखाया जाता है). बैकट्रेस उस समय से मेल खाता है जब शर्त का पता चला (यानी अगले सिस्टम कॉल या दूसरे कॉन्टेक्स्ट स्विच पर) न कि उस समय जब गलत ऐक्सेस किया गया था.
इसका मतलब है कि "मुख्य" एसिंक्रोनस एमटीई क्रैश में बैकट्रेस आम तौर पर काम का नहीं होता. इसलिए, सिंक मोड की गड़बड़ियों की तुलना में एसिंक्रोनस मोड के काम न करने की गड़बड़ियों को डीबग करना ज़्यादा मुश्किल होता है. इन्हें दिए गए थ्रेड में, आस-पास के कोड में मेमोरी बग की मौजूदगी को दिखाने के तौर पर सबसे अच्छे तरीके से समझा जा सकता है. टूंबस्टोन फ़ाइल के निचले हिस्से में मौजूद लॉग इस बात का संकेत दे सकते हैं कि वास्तव में क्या हुआ था. नहीं तो, इस गड़बड़ी को सिंक मोड में फिर से देखने और सिंक मोड से मिलने वाली बेहतर डाइग्नोस्टिक्स का इस्तेमाल करने के लिए, हमारा सुझाव है कि आप कार्रवाई करें!
बेहतर विषय
हुड के तहत, मेमोरी टैगिंग हर हीप एलोकेशन के लिए रैंडम 4-बिट (0.15) टैग वैल्यू असाइन करके काम करती है. यह वैल्यू, मेटाडेटा के एक खास क्षेत्र में सेव की जाती है. यह जगह असाइन की गई हीप मेमोरी से जुड़ी होती है. यह वैल्यू, Maloc() या ऑपरेटर new() जैसे फ़ंक्शन से लौटाए गए हीप पॉइंटर के सबसे अहम बाइट को असाइन की जाती है.
प्रक्रिया में टैग की जांच चालू होने पर सीपीयू अपने-आप पॉइंटर के टॉप बाइट की तुलना मेमोरी टैग से करता है. टैग मैच न होने पर, सीपीयू क्रैश होने का संकेत देता है.
टैग की संभावित वैल्यू की संख्या सीमित होने की वजह से, यह तरीका संभावित है. किसी भी मेमोरी स्थान को दिए गए पॉइंटर से ऐक्सेस नहीं किया जाना चाहिए - जैसे कि सीमा के बाहर या डीललोकेशन के बाद ("हैंगलिंग पॉइंटर") - का टैग मान भिन्न हो सकता है और इससे क्रैश हो सकता है. इस बात की ~7% संभावना है कि किसी गड़बड़ी के किसी एक बार भी होने का पता न चल पाए. टैग की वैल्यू रैंडम तरीके से असाइन की जाती हैं. इसलिए, अगली बार गड़बड़ी का पता लगाने की संभावना ~93% होती है.
टैग की वैल्यू, गड़बड़ी के पते वाले फ़ील्ड के साथ-साथ, रजिस्टर डंप में भी देखी जा सकती हैं. इनके बारे में नीचे बताया गया है. इस सेक्शन का इस्तेमाल यह जांचने के लिए किया जा सकता है कि टैग सही तरीके से सेट किए गए हैं या नहीं. साथ ही, समान टैग वैल्यू वाले आस-पास की दूसरी मेमोरी का पता लगाने के लिए भी इसका इस्तेमाल किया जा सकता है, क्योंकि वे रिपोर्ट में बताई गई गड़बड़ियों के अलावा, अन्य गड़बड़ियों की संभावित वजहें भी हो सकती हैं. हमें उम्मीद है कि यह मुख्य रूप से उन लोगों के लिए फ़ायदेमंद होगा जो एमटीई या सिस्टम के अन्य लो-लेवल कॉम्पोनेंट को लागू करने पर काम कर रहे हैं. इससे डेवलपर को ज़्यादा फ़ायदा नहीं होगा.
signal 11 (SIGSEGV), code 9 (SEGV_MTESERR), fault addr 0x0800007ae92853a0 Cause: [MTE]: Use After Free, 0 bytes into a 32-byte allocation at 0x7ae92853a0 x0 0000007cd94227cc x1 0000007cd94227cc x2 ffffffffffffffd0 x3 0000007fe81919c0 x4 0000007fe8191a10 x5 0000000000000004 x6 0000005400000051 x7 0000008700000021 x8 0800007ae92853a0 x9 0000000000000000 x10 0000007ae9285000 x11 0000000000000030 x12 000000000000000d x13 0000007cd941c858 x14 0000000000000054 x15 0000000000000000 x16 0000007cd940c0c8 x17 0000007cd93a1030 x18 0000007cdcac6000 x19 0000007fe8191c78 x20 0000005800eee5c4 x21 0000007fe8191c90 x22 0000000000000002 x23 0000000000000000 x24 0000000000000000 x25 0000000000000000 x26 0000000000000000 x27 0000000000000000 x28 0000000000000000 x29 0000007fe8191b70 lr 0000005800eee0bc sp 0000007fe8191b60 pc 0000005800eee0c0 pst 0000000060001000
विशेष "मेमोरी टैग" सेक्शन, क्रैश रिपोर्ट में भी दिखता है. इसमें गड़बड़ी के पते के आस-पास के मेमोरी टैग दिखाए जाते हैं. नीचे दिए गए उदाहरण में, पॉइंटर टैग "4" मेमोरी टैग "a" से मेल नहीं खाता.
Memory tags around the fault address (0x0400007b43063db5), one tag per 16 bytes: 0x7b43063500: 0 f 0 2 0 f 0 a 0 7 0 8 0 7 0 e 0x7b43063600: 0 9 0 8 0 5 0 e 0 f 0 c 0 f 0 4 0x7b43063700: 0 b 0 c 0 b 0 2 0 1 0 4 0 7 0 8 0x7b43063800: 0 b 0 c 0 3 0 a 0 3 0 6 0 b 0 a 0x7b43063900: 0 3 0 4 0 f 0 c 0 3 0 e 0 0 0 c 0x7b43063a00: 0 3 0 2 0 1 0 8 0 9 0 4 0 3 0 4 0x7b43063b00: 0 5 0 2 0 5 0 a 0 d 0 6 0 d 0 2 0x7b43063c00: 0 3 0 e 0 f 0 a 0 0 0 0 0 0 0 4 =>0x7b43063d00: 0 0 0 a 0 0 0 e 0 d 0 [a] 0 f 0 e 0x7b43063e00: 0 7 0 c 0 9 0 a 0 d 0 2 0 0 0 c 0x7b43063f00: 0 0 0 6 0 b 0 8 0 3 0 0 0 5 0 e 0x7b43064000: 0 d 0 2 0 7 0 a 0 7 0 a 0 d 0 8 0x7b43064100: 0 b 0 2 0 b 0 4 0 1 0 6 0 d 0 4 0x7b43064200: 0 1 0 6 0 f 0 2 0 f 0 6 0 5 0 c 0x7b43064300: 0 1 0 4 0 d 0 6 0 f 0 e 0 1 0 8 0x7b43064400: 0 f 0 4 0 3 0 2 0 1 0 2 0 5 0 6
टूंबस्टोन के ऐसे सेक्शन जिनमें सभी रजिस्टर वैल्यू के आस-पास मेमोरी कॉन्टेंट दिखता है, उनमें उनकी टैग वैल्यू भी दिखती हैं.
memory near x10 ([anon:scudo:primary]): 0000007b4304a000 7e82000000008101 000003e9ce8b53a0 .......~.S...... 0700007b4304a010 0000200000006001 0000000000000000 .`... .......... 0000007b4304a020 7c03000000010101 000003e97c61071e .......|..a|.... 0200007b4304a030 0c00007b4304a270 0000007ddc4fedf8 p..C{.....O.}... 0000007b4304a040 84e6000000008101 000003e906f7a9da ................ 0300007b4304a050 ffffffff00000042 0000000000000000 B............... 0000007b4304a060 8667000000010101 000003e9ea858f9e ......g......... 0400007b4304a070 0000000100000001 0000000200000002 ................ 0000007b4304a080 f5f8000000010101 000003e98a13108b ................ 0300007b4304a090 0000007dd327c420 0600007b4304a2b0 .'.}......C{... 0000007b4304a0a0 88ca000000010101 000003e93e5e5ac5 .........Z^>.... 0a00007b4304a0b0 0000007dcc4bc500 0300007b7304cb10 ..K.}......s{... 0000007b4304a0c0 0f9c000000010101 000003e9e1602280 ........."`..... 0900007b4304a0d0 0000007dd327c780 0700007b7304e2d0 ..'.}......s{... 0000007b4304a0e0 0d1d000000008101 000003e906083603 .........6...... 0a00007b4304a0f0 0000007dd327c3b8 0000000000000000 ..'.}...........