Strażnik samochodowy

Użyj programu alarmowego samochodu , aby pomóc w debugowaniu VHAL. Watchdog samochodowy monitoruje kondycję i zabija niezdrowe procesy. Aby proces był monitorowany przez system nadzoru samochodu, proces musi być zarejestrowany w systemie nadzoru samochodu. Gdy watchdog samochodu zabije niezdrowe procesy, watchdog samochodu zapisuje stan procesów w data/anr , tak jak w przypadku innych zrzutów Application Not Responding (ANR). Ułatwi to proces debugowania.

W tym artykule opisano, w jaki sposób licencje HAL i usługi dostawców mogą rejestrować proces w systemie nadzoru samochodu.

Dostawca HAL

Zazwyczaj dostawca HAL używa puli wątków dla hwbinder . Jednak klient watchdoga samochodu komunikuje się z demonem watchdoga samochodu przez binder , który różni się od hwbinder . Dlatego używana jest inna pula wątków do binder .

Określ pomoc do nadzoru samochodu w pliku makefile

 1. Uwzględnij carwatchdog_aidl_interface-ndk_platform w shared_libs :

  Android.bp :

  cc_defaults {
    name: "vhal_v2_0_defaults",
    shared_libs: [
      "libbinder_ndk",
      "libhidlbase",
      "liblog",
      "libutils",
      "android.hardware.automotive.vehicle@2.0",
      "carwatchdog_aidl_interface-ndk_platform",
    ],
    cflags: [
      "-Wall",
      "-Wextra",
      "-Werror",
    ],
  }
  

Dodaj politykę SELinux

 1. Zezwól system_server na zabicie HAL. Jeśli nie masz system_server.te , utwórz go. Zdecydowanie zaleca się dodanie polityki SELinux do każdego urządzenia.
 2. Zezwól dostawcy HAL na używanie spinacza (makro binder_use ) i dodaj dostawcę HAL do domeny klienta carwatchdog (makro carwatchdog_client_domain ). Zobacz poniższy kod dla systemserver.te i vehicle_default.te :

  serwer_systemu.te

  # Allow system_server to kill vehicle HAL
  allow system_server hal_vehicle_server:process sigkill;
  

  hal_vehicle_default.te

  # Configuration for register VHAL to car watchdog
  carwatchdog_client_domain(hal_vehicle_default)
  binder_use(hal_vehicle_default)
  

Zaimplementuj klasę klienta, dziedzicząc BnCarWatchdogClient

 1. W checkIfAlive wykonaj sprawdzanie kondycji. Na przykład publikuj w programie obsługi pętli wątków. Jeśli jest zdrowy, wywołaj ICarWatchdog::tellClientAlive . Zobacz poniższy kod dla WatchogClient.h i WatchogClient.cpp :

  WatchogClient.h

  class WatchdogClient : public aidl::android::automotive::watchdog::BnCarWatchdogClient {
   public:
    explicit WatchdogClient(const ::android::sp<::android::Looper>& handlerLooper, VehicleHalManager* vhalManager);
  
  ndk::ScopedAStatus checkIfAlive(int32_t sessionId, aidl::android::automotive::watchdog::TimeoutLength timeout) override; ndk::ScopedAStatus prepareProcessTermination() override; };

  WatchogClient.cpp

  ndk::ScopedAStatus WatchdogClient::checkIfAlive(int32_t sessionId, TimeoutLength /*timeout*/) {
    // Implement or call your health check logic here
    return ndk::ScopedAStatus::ok();
  }
  

Uruchom wątek spoiwa i zarejestruj klienta

 1. Utwórz pulę wątków do komunikacji spinacza. Jeśli dostawca HAL używa hwbinder do własnych celów, musisz utworzyć inną pulę wątków dla komunikacji z segregatorem watchdoga samochodowego).
 2. Wyszukaj demona o nazwie i wywołaj ICarWatchdog::registerClient . Nazwa interfejsu demona watchdoga samochodu to android.automotive.watchdog.ICarWatchdog/default .
 3. W oparciu o czas reakcji usługi wybierz jeden z trzech następujących typów limitu czasu obsługiwanych przez alarm samochodowy, a następnie przekaż limit czasu w wywołaniu ICarWatchdog::registerClient :
  • krytyczny(3s)
  • umiarkowany(5s)
  • normalny(10s)
  Zobacz poniższy kod dla VehicleService.cpp i WatchogClient.cpp :

  VehicleService.cpp

  int main(int /* argc */, char* /* argv */ []) {
    // Set up thread pool for hwbinder
    configureRpcThreadpool(4, false /* callerWillJoin */);
  
    ALOGI("Registering as service...");
    status_t status = service->registerAsService();
  
    if (status != OK) {
      ALOGE("Unable to register vehicle service (%d)", status);
      return 1;
    }
  
    // Setup a binder thread pool to be a car watchdog client.
    ABinderProcess_setThreadPoolMaxThreadCount(1);
    ABinderProcess_startThreadPool();
    sp<Looper> looper(Looper::prepare(0 /* opts */));
    std::shared_ptr<WatchdogClient> watchdogClient =
        ndk::SharedRefBase::make<WatchdogClient>(looper, service.get());
    // The current health check is done in the main thread, so it falls short of capturing the real
    // situation. Checking through HAL binder thread should be considered.
    if (!watchdogClient->initialize()) {
      ALOGE("Failed to initialize car watchdog client");
      return 1;
    }
    ALOGI("Ready");
    while (true) {
      looper->pollAll(-1 /* timeoutMillis */);
    }
  
    return 1;
  }
  

  WatchogClient.cpp

  bool WatchdogClient::initialize() {
    ndk::SpAIBinder binder(AServiceManager_getService("android.automotive.watchdog.ICarWatchdog/default"));
    if (binder.get() == nullptr) {
      ALOGE("Failed to get carwatchdog daemon");
      return false;
    }
    std::shared_ptr<ICarWatchdog> server = ICarWatchdog::fromBinder(binder);
    if (server == nullptr) {
      ALOGE("Failed to connect to carwatchdog daemon");
      return false;
    }
    mWatchdogServer = server;
  
    binder = this->asBinder();
    if (binder.get() == nullptr) {
      ALOGE("Failed to get car watchdog client binder object");
      return false;
    }
    std::shared_ptr<ICarWatchdogClient> client = ICarWatchdogClient::fromBinder(binder);
    if (client == nullptr) {
      ALOGE("Failed to get ICarWatchdogClient from binder");
      return false;
    }
    mTestClient = client;
    mWatchdogServer->registerClient(client, TimeoutLength::TIMEOUT_NORMAL);
    ALOGI("Successfully registered the client to car watchdog server");
    return true;
  }
  

Usługi dostawcy (natywne)

Określ plik makefile watchdoga samochodu

 1. Uwzględnij carwatchdog_aidl_interface-ndk_platform w shared_libs .

  Android.bp

  cc_binary {
    name: "sample_native_client",
    srcs: [
      "src/*.cpp"
    ],
    shared_libs: [
      "carwatchdog_aidl_interface-ndk_platform",
      "libbinder_ndk",
    ],
    vendor: true,
  }
  

Dodaj politykę SELinux

 1. Aby dodać zasadę SELinux, zezwól domenie usługi dostawcy na używanie bindera ( makro binder_use ) i dodaj domenę usługi dostawcy do domeny klienta carwatchdog ( makro carwatchdog_client_domain ). Zobacz poniższy kod dla sample_client.te i file_contexts :

  przykładowy_klient.te

  type sample_client, domain;
  type sample_client_exec, exec_type, file_type, vendor_file_type;
  
  carwatchdog_client_domain(sample_client)
  
  init_daemon_domain(sample_client)
  binder_use(sample_client)
  

  file_contexts

  /vendor/bin/sample_native_client u:object_r:sample_client_exec:s0
  

Zaimplementuj klasę klienta, dziedzicząc BnCarWatchdogClient

 1. W checkIfAlive wykonaj kontrolę kondycji. Jedną z opcji jest wysłanie wiadomości do programu obsługi pętli wątków. Jeśli jest zdrowy, wywołaj ICarWatchdog::tellClientAlive . Zobacz poniższy kod dla SampleNativeClient.h i SampleNativeClient.cpp :

  SampleNativeClient.h

  class SampleNativeClient : public BnCarWatchdogClient {
  public:
    ndk::ScopedAStatus checkIfAlive(int32_t sessionId, TimeoutLength
      timeout) override;
    ndk::ScopedAStatus prepareProcessTermination() override;
    void initialize();
  
  private:
    void respondToDaemon();
  private:
    ::android::sp<::android::Looper> mHandlerLooper;
    std::shared_ptr<ICarWatchdog> mWatchdogServer;
    std::shared_ptr<ICarWatchdogClient> mClient;
    int32_t mSessionId;
  };
  

  PrzykładowyNativeClient.cpp

  ndk::ScopedAStatus WatchdogClient::checkIfAlive(int32_t sessionId, TimeoutLength timeout) {
    mHandlerLooper->removeMessages(mMessageHandler,
      WHAT_CHECK_ALIVE);
    mSessionId = sessionId;
    mHandlerLooper->sendMessage(mMessageHandler,
      Message(WHAT_CHECK_ALIVE));
    return ndk::ScopedAStatus::ok();
  }
  // WHAT_CHECK_ALIVE triggers respondToDaemon from thread handler
  void WatchdogClient::respondToDaemon() {
   // your health checking method here
   ndk::ScopedAStatus status = mWatchdogServer->tellClientAlive(mClient,
      mSessionId);
  }
  

Rozpocznij wątek spoiwa i zarejestruj klienta

Nazwa interfejsu demona watchdoga samochodu to android.automotive.watchdog.ICarWatchdog/default .

 1. Wyszukaj demona o nazwie i wywołaj ICarWatchdog::registerClient . Zobacz poniższy kod dla main.cpp i SampleNativeClient.cpp :

  main.cpp

  int main(int argc, char** argv) {
    sp<Looper> looper(Looper::prepare(/*opts=*/0));
  
    ABinderProcess_setThreadPoolMaxThreadCount(1);
    ABinderProcess_startThreadPool();
    std::shared_ptr<SampleNativeClient> client =
      ndk::SharedRefBase::make<SampleNatvieClient>(looper);
  
    // The client is registered in initialize()
    client->initialize();
    ...
  }
  

  PrzykładowyNativeClient.cpp

  void SampleNativeClient::initialize() {
    ndk::SpAIBinder binder(AServiceManager_getService(
      "android.automotive.watchdog.ICarWatchdog/default"));
    std::shared_ptr<ICarWatchdog> server =
      ICarWatchdog::fromBinder(binder);
    mWatchdogServer = server;
    ndk::SpAIBinder binder = this->asBinder();
    std::shared_ptr<ICarWatchdogClient> client =
      ICarWatchdogClient::fromBinder(binder)
    mClient = client;
    server->registerClient(client, TimeoutLength::TIMEOUT_NORMAL);
  }
  

Usługi dostawcy (Android)

Zaimplementuj klienta dziedzicząc CarWatchdogClientCallback

 1. Edytuj nowy plik w następujący sposób:
  private final CarWatchdogClientCallback mClientCallback = new CarWatchdogClientCallback() {
    @Override
    public boolean onCheckHealthStatus(int sessionId, int timeout) {
      // Your health check logic here
      // Returning true implies the client is healthy
      // If false is returned, the client should call
      // CarWatchdogManager.tellClientAlive after health check is
      // completed
    }
  
    @Override
    public void onPrepareProcessTermination() {}
  };
  

Zarejestruj klienta

 1. Zadzwoń do CarWatchdogManager.registerClient() :
  private void startClient() {
    CarWatchdogManager manager =
      (CarWatchdogManager) car.getCarManager(
      Car.CAR_WATCHDOG_SERVICE);
    // Choose a proper executor according to your health check method
    ExecutorService executor = Executors.newFixedThreadPool(1);
    manager.registerClient(executor, mClientCallback,
      CarWatchdogManager.TIMEOUT_NORMAL);
  }
  

Wyrejestruj klienta

 1. Wywołaj CarWatchdogManager.unregisterClient() po zakończeniu usługi:
  private void finishClient() {
    CarWatchdogManager manager =
      (CarWatchdogManager) car.getCarManager(
      Car.CAR_WATCHDOG_SERVICE);
    manager.unregisterClient(mClientCallback);
  }
  

Wykryj procesy zakończone przez system nadzoru samochodu

Procesy zrzutów/zabijania systemu nadzoru samochodu (HAL dostawcy, natywne usługi dostawcy, usługi Androida dostawcy), które są zarejestrowane w systemie nadzoru samochodu, gdy utkną i nie będą odpowiadać. Takie zrzucanie jest wykrywane przez sprawdzanie dzienników. Watchdog samochodu wyprowadza dziennik carwatchdog killed process_name (pid:process_id) , gdy problematyczny proces zostanie zrzucony lub zabity. Dlatego:

$ adb logcat -s CarServiceHelper | fgrep "carwatchdog killed"

Przechowywane są odpowiednie dzienniki. Na przykład, jeśli aplikacja KitchenSink (klient nadzorujący samochód) utknie, w dzienniku zostanie zapisany wiersz taki jak poniżej:

05-01 09:50:19.683  578 5777 W CarServiceHelper: carwatchdog killed com.google.android.car.kitchensink (pid: 5574)

Aby ustalić, dlaczego lub gdzie zablokowała się aplikacja KitchenSink, użyj zrzutu procesu przechowywanego w /data/anr , tak jak w przypadku przypadków ANR aktywności.

$ adb root
$ adb shell grep -Hn "pid process_pid" /data/anr/*

Poniższe przykładowe dane wyjściowe są specyficzne dla aplikacji KitchenSink:

$ adb shell su root grep -Hn "pid 5574" /data/anr/*.
/data/anr/anr_2020-05-01-09-50-18-290:3:----- pid 5574 at 2020-05-01 09:50:18 -----
/data/anr/anr_2020-05-01-09-50-18-290:285:----- Waiting Channels: pid 5574 at 2020-05-01 09:50:18 -----

Znajdź plik zrzutu (na przykład /data/anr/anr_2020-05-01-09-50-18-290 w powyższym przykładzie) i rozpocznij analizę.