實現文本分類器

文本分類器使用機器學習技術來幫助開發人員對文本進行分類。

Android 11 發布文本分類器

Android的11介紹了文本分類服務的更新的缺省實現ExtServices模塊。在運行Android 11或更高,該裝置getTextClassifier()方法返回的ExtServices模塊在這個默認實現。設備製造商建議使用這種實現的TextClassifierService ,因為它可以通過主線OTA更新來更新。

Android的11也刪除以前所介紹的本地文本分類默認實現的Android 8.1 。其結果是, getLocalTextClassifier()返回一個NO_OP文本分類。取而代之的是本地執行的,你應該使用getDefaultTextClassifierImplementation()方法。

對於設備製造商誰可能想用自己的文本分類算法,它們可以通過指定實現自定義文本分類服務config_defaultTextClassifierPackageconfig.xml文件中。如果未指定此配置,則使用默認系統實現。自定義實現可以通過調用得到默認實現的實例TextClassifierService.getDefaultTextClassifierImplementation(Context) 。欲了解更多信息,請參見實現自定義文本分類服務

測試

為了驗證您的文本分類服務的實現,使用兼容性測試套件(CTS)的測試platform/cts/tests/tests/textclassifier/

Android 10 發布文本分類器增強功能

Android的10引入了兩種方法的TextClassifier API: suggestConversationActionsdetectLanguage 。該suggestConversationActions方法從給定的對話產生建議的答复和行動和detectLanguage方法檢測文本的語言。

這些方法的模型文件顯示下方,可以發現external/libtextclassifier/models/

  • suggestionConversationActions actions_suggestions.universal.model
  • detectLanguage lang_id.model

要使用出廠映像中的最新模型文件發佈設備,請執行以下操作:

  1. 獲取最新的模型文件。

    external/libtextclassifier/models/update.sh
    
  2. 重命名下載的文件以替換現有文件。
  3. 驗證設置。
    adb shell dumpsys textclassification
    

    這是該命令的輸出示例。

    TextClassifierImpl:
      Annotator model file(s):
        ModelFile { path=/etc/textclassifier/textclassifier.universal.model name=textclassifier.universal.model version=608 locales=und }
        ModelFile { path=/etc/textclassifier/textclassifier.en.model name=textclassifier.en.model version=608 locales=en }
      LangID model file(s):
        ModelFile { path=/etc/textclassifier/lang_id.model name=lang_id.model version=0 locales=und }
      Actions model file(s):
        ModelFile { path=/etc/textclassifier/actions_suggestions.universal.model name=actions_suggestions.universal.model version=0 locales=und }
    

Android 9 發布文本分類器增強功能

Android的9延長了在安卓8.1中引入文本分類框架與新的文本分類服務。文本分類器服務是 OEM 提供文本分類系統支持的推薦方式。文本分類器服務可以是任何系統 APK 的一部分,並且可以在必要時進行更新。

Android的9包括默認的文本分類服務實現( TextClassifierImpl除非你有一個自定義的文本分類服務實現替換它時使用)。

實現自定義文本分類器服務

以下部分描述瞭如何實現您開發的自定義文本分類器服務。

擴展 android.service.textclassifier.TextClassifierService

public final class TextClassifierServiceImpl
        extends TextClassifierService {

    // Returns TextClassifierImpl.
    private final TextClassifier tc = getLocalTextClassifier();

    @Override
    public void onSuggestSelection(
            @Nullable TextClassificationSessionId sessionId,
            @NonNull TextSelection.Request request,
            @NonNull CancellationSignal cancellationSignal,
            @NonNull Callback<TextSelection> callback) {
        CompletableFuture.supplyAsync(
                () -> tc.suggestSelection(request))
                .thenAccept(r -> callback.onSuccess(r));
    }

    @Override
    public void onClassifyText(
            @Nullable TextClassificationSessionId sessionId,
		@NonNull TextClassification.Request request,
		@NonNull CancellationSignal cancellationSignal,
		@NonNull Callback<TextClassification> callback) {
        ...
    }

    @Override
    public void onGenerateLinks(
            @Nullable TextClassificationSessionId sessionId,
            @NonNull TextLinks.Request request,
            @NonNull CancellationSignal cancellationSignal,
            @NonNull Callback<TextLinks> callback) {
        ...
    }
    ...
}

在 Android 清單中定義服務

[AndroidManifest.xml]

<service android:name=".TextClassifierServiceImpl"
  android:permission="android.permission.BIND_TEXTCLASSIFIER_SERVICE">
    <intent-filter>
      <action android:name=
        "android.service.textclassifier.TextClassifierService"/>
    </intent-filter>
</service>

請注意,服務必須要求android.permission.BIND_TEXTCLASSIFIER_SERVICE權限,並且必須指定android.service.textclassifier.TextClassifierService意圖動作。

在配置覆蓋中設置系統默認文本分類器服務

[config.xml中]

<string name="config_defaultTextClassifierPackage" translatable="false">com.example.textclassifierservice</string>

將文本分類器服務構建到系統鏡像中

您的自定義文本分類器服務可以是內置於系統映像中的獨立 APK,也可以是另一個系統 APK 的一部分。該系統採用PackageManager.MATCH_SYSTEM_ONLY解析服務。

測試

在運行測試android.view.textclassifier.cts

Android 9 中的其他文本分類變化

請參閱檢查安裝的語言模塊

Android 9 模型文件與 Android 8.x 模型文件不兼容。

機器人9模型文件具有命名模式: texclassifier.[language-code].model (例如, textclassifier.en.model )代替textclassifier.smartselection.en.model Android中8.x中

獲取最新的文本分類模型文件

要獲得最新的模型,可以運行以下腳本,更新源樹中的 TextClassifier 模型:

external/libtextclassifier/native/models/update.sh

Android 版本 8.1 文本分類器

Android 8.1 引入了 TextClassfier API 來實現文本分類。

TextClassificationManager tcm =
    context.getSystemService(TextClassificationManager.class);
TextClassifier classifier = tcm.getTextClassifier();
TextSelection selection = classifier.suggestSelection(...);
TextClassification classification = classifier.classifyText(...);

開發人員可以設置自定義文本分類器:

tcm.setTextClassifier(customTextClassifier);

但是,如果一個應用程序開發者設置文本分類到null ,則返回系統默認的文本分類的getTextClassifier()

android.view.textclassifier.TextClassifierImpl

TextView 和 WebView 使用 TextClassifier 來實現智能選擇和智能文本共享功能。

文本分類器使用

圖1. TextClassifier使用

TextClassifier 神經網絡模型

Android 開源項目 (AOSP) 具有許多用於分類文本的神經網絡模型。每個模型文件都針對一種語言進行訓練。您可以安裝任意組合的模型。模型定義在:

external/libtextclassifier/Android.mk

在設備上預安裝語言模型

您可以指定一組語言模型並將它們安裝在設備上:

# -----------------------
# Smart Selection bundles
# -----------------------

include $(CLEAR_VARS)
LOCAL_MODULE           := textclassifier.smartselection.bundle1
LOCAL_REQUIRED_MODULES := textclassifier.smartselection.en.model
LOCAL_REQUIRED_MODULES += textclassifier.smartselection.es.model
LOCAL_REQUIRED_MODULES += textclassifier.smartselection.de.model
LOCAL_REQUIRED_MODULES += textclassifier.smartselection.fr.model
include $(BUILD_STATIC_LIBRARY)

例如,在device/google/marlin/device-common.mk

# TextClassifier smart selection model files
PRODUCT_PACKAGES += \
    textclassifier.smartselection.bundle1

檢查已安裝的語言模塊

使用 ADB 列出目錄中的文件:

$ adb shell ls -l /etc/textclassifier
-rw-r--r-- 1 root root ... textclassifier.smartselection.de.model
-rw-r--r-- 1 root root ... textclassifier.smartselection.en.model
-rw-r--r-- 1 root root ... textclassifier.smartselection.es.model
-rw-r--r-- 1 root root ... textclassifier.smartselection.fr.model

模型更新

模型可以通過具有包括作為系統圖像更新的一部分的新模型,或者動態地通過具有系統組件來更新觸發通過系統的更新API ACTION_UPDATE_SMART_SELECTION意圖。通過廣播這個系統 API 意圖,框架能夠更新當前設置語言的語言模型。模型本身包含支持的語言和版本號,因此使用最新的適當模型。

因此您不需要為所有語言預加載模型,因為它們可以在以後添加。如果未找到指定語言的模型文件,文本分類將返回無操作值。

兼容性測試套件測試

相關的 Android 兼容性測試套件 (CTS) 測試可以在以下位置找到:

cts/tests/tests/view/src/android/view/textclassifier/cts/TextClassificationManagerTest.java

cts/tests/tests/widget/src/android/widget/cts/TextViewTest.java

  • testSmartSelection
  • testSmartSelection_dragSelection
  • testSmartSelection_resetSelection