Viết mờ bằng libFuzzer

Kỹ thuật mờ (fuzzing) chỉ đơn giản là cung cấp các dữ liệu có khả năng không hợp lệ, không mong muốn hoặc ngẫu nhiên làm dữ liệu đầu vào cho chương trình, là một cách cực kỳ hiệu quả để tìm lỗi trong hệ thống phần mềm lớn và là một phần quan trọng trong quá trình phát triển phần mềm vòng đời công việc.

Hệ thống xây dựng của Android hỗ trợ tính năng làm mờ thông qua việc đưa libFuzzer vào từ dự án dự án cơ sở hạ tầng trình biên dịch LLVM. LibFuzzer được liên kết với thư viện đang được kiểm thử và xử lý mọi dữ liệu đầu vào báo cáo lựa chọn, đột biến và sự cố xảy ra trong phiên kiểm thử mờ. Trình dọn dẹp của LLVM được dùng để hỗ trợ việc phát hiện lỗi bộ nhớ và mã chỉ số về mức độ phù hợp.

Bài viết này giới thiệu về libFuzzer trên Android và cách thực hiện một bản dựng được đo lường. Tài liệu này cũng bao gồm các hướng dẫn để viết, chạy và tuỳ chỉnh bộ kiểm thử mờ.

Thiết lập và xây dựng

Để đảm bảo bạn có hình ảnh hoạt động đang chạy trên thiết bị, bạn có thể tải xuống nhà máy và cài đặt ROM thiết bị. Ngoài ra, bạn có thể tải nguồn AOSP xuống rồi làm theo hướng dẫn thiết lập và tạo ví dụ ở bên dưới.

Ví dụ về cách thiết lập

Ví dụ này giả định thiết bị mục tiêu là một Pixel (taimen) và đã được chuẩn bị để gỡ lỗi qua USB (aosp_taimen-userdebug). Bạn có thể tải các tệp nhị phân Pixel khác xuống từ Driver Binaries.

mkdir ~/bin
export PATH=~/bin:$PATH
curl https://storage.googleapis.com/git-repo-downloads/repo > ~/bin/repo
chmod a+x ~/bin/repo
repo init -u https://android.googlesource.com/platform/manifest -b main
repo sync -c -j8
wget https://dl.google.com/dl/android/aosp/google_devices-taimen-qq1a.191205.008-f4537f93.tgz
tar xvf google_devices-taimen-qq1a.191205.008-f4537f93.tgz
./extract-google_devices-taimen.sh
wget https://dl.google.com/dl/android/aosp/qcom-taimen-qq1a.191205.008-760afa6e.tgz
tar xvf qcom-taimen-qq1a.191205.008-760afa6e.tgz
./extract-qcom-taimen.sh
. build/envsetup.sh
lunch aosp_taimen-userdebug

Ví dụ về bản dựng

Bước đầu tiên để chạy mục tiêu mờ là tải hình ảnh hệ thống mới. T4 khuyên bạn nên sử dụng phiên bản phát triển mới nhất của Android.

  1. Thực hiện bản dựng ban đầu bằng cách phát hành:
    m
  2. Để cho phép bạn cài đặt ROM thiết bị, hãy khởi động thiết bị ở chế độ khởi động nhanh bằng phù hợp tổ hợp phím.
  3. Mở khoá trình tải khởi động và cài đặt ROM hình ảnh mới biên dịch bằng lệnh sau các lệnh.
    fastboot oem unlock
    fastboot flashall
    

Thiết bị mục tiêu hiện đã sẵn sàng để kiểm thử mờ libFuzzer.

Viết một công cụ kiểm thử mờ

Để minh hoạ việc viết chương trình kiểm thử mờ (fuzzer) toàn diện bằng libFuzzer trong Android, hãy sử dụng sau đây là mã dễ bị tấn công làm trường hợp kiểm thử. Thao tác này giúp kiểm thử trình mờ, đảm bảo mọi thứ đều hoạt động chính xác và minh hoạ dữ liệu sự cố trông như thế nào.

Đây là hàm kiểm thử.

#include <stdint.h>
#include <stddef.h>
bool FuzzMe(const char *data, size_t dataSize) {
    return dataSize >= 3  &&
           data[0] == 'F' &&
           data[1] == 'U' &&
           data[2] == 'Z' &&
           data[3] == 'Z';  // ← Out of bounds access
}

Cách tạo và chạy kiểm thử mờ:

  1. Đích mờ bao gồm hai tệp: một tệp bản dựng và mã nguồn đích mờ. Tạo tệp ở vị trí bên cạnh thư viện mà bạn đang kiểm thử mờ. Đặt dấu kiểm mờ tên mô tả chức năng của trình kiểm thử mờ.
  2. Viết mục tiêu mờ bằng libFuzzer. Mục tiêu mờ là một hàm lấy một blob dữ liệu có kích thước được chỉ định và chuyển vào hàm để mờ. Dưới đây là một trình kiểm thử mờ cơ bản cho hàm kiểm thử dễ bị tấn công:
    #include <stddef.h>
    #include <stdint.h>
    
    extern "C" int LLVMFuzzerTestOneInput(const char *data, size_t size) {
      // ...
      // Use the data to call the library you are fuzzing.
      // ...
      return FuzzMe(data, size);
    }
    
  3. Yêu cầu hệ thống xây dựng của Android tạo tệp nhị phân mờ (fuzzer). Để tạo trình kiểm thử mờ, hãy thêm mã sau vào tệp Android.bp:
    cc_fuzz {
      name: "fuzz_me_fuzzer",
      srcs: [
        "fuzz_me_fuzzer.cpp",
      ],
      // If the fuzzer has a dependent library, uncomment the following section and
      // include it.
      // static_libs: [
      //   "libfoo", // Dependent library
      // ],
      //
      // The advanced features below allow you to package your corpus and
      // dictionary files during building. You can find more information about
      // these features at:
      //  - Corpus: https://llvm.org/docs/LibFuzzer.html#corpus
      //  - Dictionaries: https://llvm.org/docs/LibFuzzer.html#dictionaries
      // These features are not required for fuzzing, but are highly recommended
      // to gain extra coverage.
      // To include a corpus folder, uncomment the following line.
      // corpus: ["corpus/*"],
      // To include a dictionary, uncomment the following line.
      // dictionary: "fuzz_me_fuzzer.dict",
    }
    
  4. Cách tạo trình kiểm thử mờ để chạy trên mục tiêu (Thiết bị):
    SANITIZE_TARGET=hwaddress m fuzz_me_fuzzer
    
  5. Cách tạo trình kiểm thử mờ để chạy trên máy chủ lưu trữ:
    SANITIZE_HOST=address m fuzz_me_fuzzer
    

Để thuận tiện, hãy xác định một số biến shell chứa đường dẫn đến mã mờ của bạn đích và tên của tệp nhị phân (từ tệp bản dựng mà bạn đã viết trước đó).

export FUZZER_NAME=your_fuzz_target

Sau khi làm theo các bước này, bạn sẽ có một trình kiểm thử mờ (fuzzer). Mặc định vị trí của bộ kiểm thử mờ (trong ví dụ này về bản dựng Pixel) là:

  • $ANDROID_PRODUCT_OUT/data/fuzz/$TARGET_ARCH/$FUZZER_NAME/$FUZZER_NAME cho thiết bị.
  • $ANDROID_HOST_OUT/fuzz/$TARGET_ARCH/$FUZZER_NAME/$FUZZER_NAME cho máy chủ lưu trữ.
  • Chạy trình kiểm thử mờ trên máy chủ

  • Thêm vào tệp bản dựng Android.bp:
    host_supported: true,
    Lưu ý rằng bạn chỉ có thể áp dụng phương thức này nếu thư viện mà bạn muốn kiểm thử mờ là máy chủ lưu trữ được hỗ trợ.
  • Chạy trình kiểm thử mờ trên máy chủ bằng cách chạy tệp nhị phân của trình kiểm thử mờ đã tạo:
    $ANDROID_HOST_OUT/fuzz/x86_64/$FUZZER_NAME/$FUZZER_NAME
  • Chạy trình kiểm thử mờ trên thiết bị

    Chúng tôi muốn sao chép nội dung này sang thiết bị của bạn bằng adb.

    1. Để tải các tệp này lên một thư mục trên thiết bị, hãy chạy các các lệnh:
      adb root
      adb sync data
      
    2. Chạy trình kiểm thử mờ trên thiết bị bằng lệnh sau:
      adb shell /data/fuzz/$(get_build_var TARGET_ARCH)/$FUZZER_NAME/$FUZZER_NAME \
        /data/fuzz/$(get_build_var TARGET_ARCH)/$FUZZER_NAME/corpus

    Thao tác này sẽ cho ra kết quả tương tự như kết quả trong ví dụ dưới đây.

    INFO: Seed: 913963180
    INFO: Loaded 2 modules   (16039 inline 8-bit counters): 16033 [0x7041769b88, 0x704176da29), 6 [0x60e00f4df0, 0x60e00f4df6),
    INFO: Loaded 2 PC tables (16039 PCs): 16033 [0x704176da30,0x70417ac440), 6 [0x60e00f4df8,0x60e00f4e58),
    INFO: -max_len is not provided; libFuzzer will not generate inputs larger than 4096 bytes
    INFO: A corpus is not provided, starting from an empty corpus
    #2	INITED cov: 5 ft: 5 corp: 1/1b exec/s: 0 rss: 24Mb
    #10	NEW    cov: 6 ft: 6 corp: 2/4b lim: 4 exec/s: 0 rss: 24Mb L: 3/3 MS: 3 CopyPart-ChangeByte-InsertByte-
    #712	NEW    cov: 7 ft: 7 corp: 3/9b lim: 8 exec/s: 0 rss: 24Mb L: 5/5 MS: 2 InsertByte-InsertByte-
    #744	REDUCE cov: 7 ft: 7 corp: 3/7b lim: 8 exec/s: 0 rss: 25Mb L: 3/3 MS: 2 ShuffleBytes-EraseBytes-
    #990	REDUCE cov: 8 ft: 8 corp: 4/10b lim: 8 exec/s: 0 rss: 25Mb L: 3/3 MS: 1 ChangeByte-
    ==18631==ERROR: HWAddressSanitizer: tag-mismatch on address 0x0041e00b4183 at pc 0x0060e00c5144
    READ of size 1 at 0x0041e00b4183 tags: f8/03 (ptr/mem) in thread T0
        #0 0x60e00c5140  (/data/fuzz/arm64/example_fuzzer/example_fuzzer+0xf140)
        #1 0x60e00ca130  (/data/fuzz/arm64/example_fuzzer/example_fuzzer+0x14130)
        #2 0x60e00c9b8c  (/data/fuzz/arm64/example_fuzzer/example_fuzzer+0x13b8c)
        #3 0x60e00cb188  (/data/fuzz/arm64/example_fuzzer/example_fuzzer+0x15188)
        #4 0x60e00cbdec  (/data/fuzz/arm64/example_fuzzer/example_fuzzer+0x15dec)
        #5 0x60e00d8fbc  (/data/fuzz/arm64/example_fuzzer/example_fuzzer+0x22fbc)
        #6 0x60e00f0a98  (/data/fuzz/arm64/example_fuzzer/example_fuzzer+0x3aa98)
        #7 0x7041b75d34  (/data/fuzz/arm64/lib/libc.so+0xa9d34)
    
    [0x0041e00b4180,0x0041e00b41a0) is a small allocated heap chunk; size: 32 offset: 3
    0x0041e00b4183 is located 0 bytes to the right of 3-byte region [0x0041e00b4180,0x0041e00b4183)
    allocated here:
        #0 0x70418392bc  (/data/fuzz/arm64/lib/libclang_rt.hwasan-aarch64-android.so+0x212bc)
        #1 0x60e00ca040  (/data/fuzz/arm64/example_fuzzer/example_fuzzer+0x14040)
        #2 0x60e00c9b8c  (/data/fuzz/arm64/example_fuzzer/example_fuzzer+0x13b8c)
        #3 0x60e00cb188  (/data/fuzz/arm64/example_fuzzer/example_fuzzer+0x15188)
        #4 0x60e00cbdec  (/data/fuzz/arm64/example_fuzzer/example_fuzzer+0x15dec)
        #5 0x60e00d8fbc  (/data/fuzz/arm64/example_fuzzer/example_fuzzer+0x22fbc)
        #6 0x60e00f0a98  (/data/fuzz/arm64/example_fuzzer/example_fuzzer+0x3aa98)
        #7 0x7041b75d34  (/data/fuzz/arm64/lib/libc.so+0xa9d34)
        #8 0x60e00c504c  (/data/fuzz/arm64/example_fuzzer/example_fuzzer+0xf04c)
        #9 0x70431aa9c4  (/data/fuzz/arm64/example_fuzzer/example_fuzzer+0x519c4)
    
    Thread: T1 0x006700006000 stack: [0x007040c55000,0x007040d4ecc0) sz: 1023168 tls: [0x000000000000,0x000000000000)
    Thread: T0 0x006700002000 stack: [0x007fe51f3000,0x007fe59f3000) sz: 8388608 tls: [0x000000000000,0x000000000000)
    Memory tags around the buggy address (one tag corresponds to 16 bytes):
       00  00  00  00  00  00  00  00  00  00  00  00  00  00  00  00
       00  00  00  00  00  00  00  00  00  00  00  00  00  00  00  00
       00  00  00  00  00  00  00  00  00  00  00  00  00  00  00  00
       00  00  00  00  00  00  00  00  00  00  00  00  00  00  00  00
       00  00  00  00  00  00  00  00  00  00  00  00  00  00  00  00
       00  00  00  00  00  00  00  00  00  00  00  00  00  00  00  00
       00  00  00  00  00  00  00  00  00  00  00  00  00  00  00  00
       08  00  cf  08  dc  08  cd  08  b9  08  1a  1a  0b  00  04  3f
    => 27  00  08  00  bd  bd  2d  07 [03] 73  66  66  27  27  20  f6 <=
       5b  5b  87  87  03  00  01  00  4f  04  24  24  03  39  2c  2c
       05  00  04  00  be  be  85  85  04  00  4a  4a  05  05  5f  5f
       00  00  00  00  00  00  00  00  00  00  00  00  00  00  00  00
       00  00  00  00  00  00  00  00  00  00  00  00  00  00  00  00
       00  00  00  00  00  00  00  00  00  00  00  00  00  00  00  00
       00  00  00  00  00  00  00  00  00  00  00  00  00  00  00  00
       00  00  00  00  00  00  00  00  00  00  00  00  00  00  00  00
       00  00  00  00  00  00  00  00  00  00  00  00  00  00  00  00
    Tags for short granules around the buggy address (one tag corresponds to 16 bytes):
       04  ..  ..  cf  ..  dc  ..  cd  ..  b9  ..  ..  3f  ..  57  ..
    => ..  ..  21  ..  ..  ..  ..  2d [f8] ..  ..  ..  ..  ..  ..  .. <=
       ..  ..  ..  ..  9c  ..  e2  ..  ..  4f  ..  ..  99  ..  ..  ..
    See https://clang.llvm.org/docs/HardwareAssistedAddressSanitizerDesign.html#short-granules for a description of short granule tags
    Registers where the failure occurred (pc 0x0060e00c5144):
        x0  f8000041e00b4183  x1  000000000000005a  x2  0000000000000006  x3  000000704176d9c0
        x4  00000060e00f4df6  x5  0000000000000004  x6  0000000000000046  x7  000000000000005a
        x8  00000060e00f4df0  x9  0000006800000000  x10 0000000000000001  x11 00000060e0126a00
        x12 0000000000000001  x13 0000000000000231  x14 0000000000000000  x15 000e81434c909ede
        x16 0000007041838b14  x17 0000000000000003  x18 0000007042b80000  x19 f8000041e00b4180
        x20 0000006800000000  x21 000000000000005a  x22 24000056e00b4000  x23 00000060e00f5200
        x24 00000060e0128c88  x25 00000060e0128c20  x26 00000060e0128000  x27 00000060e0128000
        x28 0000007fe59f16e0  x29 0000007fe59f1400  x30 00000060e00c5144
    SUMMARY: HWAddressSanitizer: tag-mismatch (/data/fuzz/arm64/example_fuzzer/example_fuzzer+0xf140)
    MS: 1 ChangeByte-; base unit: e09f9c158989c56012ccd88111b82f778a816eae
    0x46,0x55,0x5a,
    FUZ
    artifact_prefix='./'; Test unit written to ./crash-0eb8e4ed029b774d80f2b66408203801cb982a60
    Base64: RlVa
    

    Trong kết quả mẫu, sự cố là do fuzz_me_fuzzer.cpp gây ra ở dòng 10:

          data[3] == 'Z';  // :(
    

    Đây là một thao tác đơn giản nằm ngoài giới hạn nếu data có độ dài 3.

    Sau khi bạn chạy trình kiểm thử mờ, kết quả thường dẫn đến sự cố và lỗi vi phạm dữ liệu đầu vào được lưu trong tập sao lục và được cấp một mã nhận dạng. Trong kết quả của ví dụ, đây là crash-0eb8e4ed029b774d80f2b66408203801cb982a60.

    Để truy xuất thông tin sự cố khi làm mờ trên thiết bị, hãy phát lệnh này chỉ định ID sự cố của bạn:

    adb pull /data/fuzz/arm64/fuzz_me_fuzzer/corpus/CRASH_ID
    Lưu ý rằng để lưu các trường hợp kiểm thử vào đúng thư mục, bạn có thể sử dụng thư mục tập sao lục (như trong ví dụ ở trên) hoặc sử dụng đối số audience_prefix (ví dụ: `-artifact_prefix=/data/fuzz/where/my/crashes/go`).

    Khi kiểm thử mờ trên máy chủ lưu trữ, thông tin về sự cố sẽ xuất hiện trong thư mục sự cố trong thư mục cục bộ nơi trình kiểm thử đang chạy.

    Tạo mức độ bao phủ đường

    Mức độ bao phủ của dòng rất hữu ích cho các nhà phát triển vì họ có thể xác định các vùng trong mã không và cập nhật bộ kiểm thử mờ sao cho phù hợp để tiếp cận những khu vực đó trong các lần chạy kiểm thử mờ trong tương lai.

    1. Để tạo báo cáo mức độ sử dụng mờ, hãy chạy các bước sau :
      CLANG_COVERAGE=true NATIVE_COVERAGE_PATHS='*' make ${FUZZER_NAME}
      
    2. Sau khi đẩy trình kiểm thử mờ và các phần phụ thuộc của trình kiểm thử mờ đó vào thiết bị, chạy mục tiêu mờ với LLVM_PROFILE_FILE như sau:
      DEVICE_TRACE_PATH=/data/fuzz/$(get_build_var TARGET_ARCH)/${FUZZER_NAME}/data.profraw
      adb shell LLVM_PROFILE_FILE=${DEVICE_TRACE_PATH} /data/fuzz/$(get_build_var TARGET_ARCH)/${FUZZER_NAME}/${FUZZER_NAME} -runs=1000
      
    3. Tạo báo cáo mức độ sử dụng bằng cách trước tiên kéo tệp profraw từ thiết bị, sau đó tạo báo cáo html vào thư mục Coverage-html như minh hoạ bên dưới:
      adb pull ${DEVICE_TRACE_PATH} data.profraw
      llvm-profdata merge --sparse data.profraw --output data.profdata
      llvm-cov show --format=html --instr-profile=data.profdata \
        symbols/data/fuzz/$(get_build_var TARGET_ARCH)/${FUZZER_NAME}/${FUZZER_NAME} \
        --output-dir=coverage-html --path-equivalence=/proc/self/cwd/,$ANDROID_BUILD_TOP
      

    Để biết thêm thông tin về libFuzzer, hãy xem tài liệu về quá trình tải lên trước.