實現文本分類器

文本分類器使用機器學習技術來幫助開發人員對文本進行分類。

Android 11 發布文本分類器

Android 11 在ExtServices 模塊中引入了文本分類器服務的可更新默認實現。在運行 Android 11 或更高版本的設備上, getTextClassifier()方法在 ExtServices 模塊中返回此默認實現。建議設備製造商使用此TextClassifierService實現,因為它可以通過 Mainline OTA 更新進行更新。

Android 11 還移除了之前在Android 8.1中引入的本地文本分類器默認實現。因此, getLocalTextClassifier()返回一個NO_OP文本分類器。您應該使用getDefaultTextClassifierImplementation()方法而不是本地實現。

對於可能想要使用自己的文本分類算法的設備製造商,他們可以通過在config.xml文件中指定config_defaultTextClassifierPackage來實現自定義文本分類器服務。如果未指定此配置,則使用默認系統實現。自定義實現可以通過調用TextClassifierService.getDefaultTextClassifierImplementation(Context)來獲取默認實現的實例。有關更多信息,請參閱實現自定義文本分類器服務

測試

要驗證文本分類器服務的實現,請使用platform/cts/tests/tests/textclassifier/中的兼容性測試套件 (CTS) 測試。

Android 10 發布文本分類器增強功能

Android 10 為 TextClassifier API 引入了兩種方法: suggestConversationActionsdetectLanguagesuggestConversationActions方法從給定的對話中生成建議的回復和操作,而detectLanguage方法檢測文本的語言。

這些方法的模型文件如下所示,可以在external/libtextclassifier/models/中找到。

  • suggestionConversationActions對話行動: actions_suggestions.universal.model
  • detectLanguage lang_id.model

要在出廠映像中發布具有最新模型文件的設備,請執行以下操作:

  1. 獲取最新的模型文件。

    external/libtextclassifier/models/update.sh
    
  2. 重命名下載的文件以替換現有文件。
  3. 驗證設置。
    adb shell dumpsys textclassification
    

    這是該命令的輸出示例。

    TextClassifierImpl:
      Annotator model file(s):
        ModelFile { path=/etc/textclassifier/textclassifier.universal.model name=textclassifier.universal.model version=608 locales=und }
        ModelFile { path=/etc/textclassifier/textclassifier.en.model name=textclassifier.en.model version=608 locales=en }
      LangID model file(s):
        ModelFile { path=/etc/textclassifier/lang_id.model name=lang_id.model version=0 locales=und }
      Actions model file(s):
        ModelFile { path=/etc/textclassifier/actions_suggestions.universal.model name=actions_suggestions.universal.model version=0 locales=und }
    

Android 9 發布文本分類器增強功能

Android 9 使用新的文本分類器服務擴展了Android 8.1 中引入的文本分類框架。文本分類器服務是 OEM 提供文本分類系統支持的推薦方式。文本分類器服務可以是任何系統 APK 的一部分,並且可以在必要時進行更新。

Android 9 包含一個默認文本分類器服務實現 ( TextClassifierImpl ),除非您將其替換為自定義文本分類器服務實現,否則將使用該服務實現。

實現自定義文本分類器服務

以下部分描述瞭如何實現您開發的自定義文本分類器服務。

擴展 android.service.textclassifier.TextClassifierService

public final class TextClassifierServiceImpl
        extends TextClassifierService {

    // Returns TextClassifierImpl.
    private final TextClassifier tc = getLocalTextClassifier();

    @Override
    public void onSuggestSelection(
            @Nullable TextClassificationSessionId sessionId,
            @NonNull TextSelection.Request request,
            @NonNull CancellationSignal cancellationSignal,
            @NonNull Callback<TextSelection> callback) {
        CompletableFuture.supplyAsync(
                () -> tc.suggestSelection(request))
                .thenAccept(r -> callback.onSuccess(r));
    }

    @Override
    public void onClassifyText(
            @Nullable TextClassificationSessionId sessionId,
		@NonNull TextClassification.Request request,
		@NonNull CancellationSignal cancellationSignal,
		@NonNull Callback<TextClassification> callback) {
        ...
    }

    @Override
    public void onGenerateLinks(
            @Nullable TextClassificationSessionId sessionId,
            @NonNull TextLinks.Request request,
            @NonNull CancellationSignal cancellationSignal,
            @NonNull Callback<TextLinks> callback) {
        ...
    }
    ...
}

在 Android 清單中定義服務

[AndroidManifest.xml]

<service android:name=".TextClassifierServiceImpl"
  android:permission="android.permission.BIND_TEXTCLASSIFIER_SERVICE">
    <intent-filter>
      <action android:name=
        "android.service.textclassifier.TextClassifierService"/>
    </intent-filter>
</service>

請注意,該服務必須需要android.permission.BIND_TEXTCLASSIFIER_SERVICE權限,並且必須指定android.service.textclassifier.TextClassifierService意圖操作。

在配置覆蓋中設置系統默認文本分類器服務

[配置.xml ]

<string name="config_defaultTextClassifierPackage" translatable="false">com.example.textclassifierservice</string>

將文本分類器服務構建到系統映像中

您的自定義文本分類器服務可以是內置在系統映像中的獨立 APK,也可以是另一個系統 APK 的一部分。系統使用PackageManager.MATCH_SYSTEM_ONLY來解析服務。

測試

android.view.textclassifier.cts中運行測試。

Android 9 中的其他文本分類更改

請參閱檢查已安裝的語言模塊

Android 9 模型文件與 Android 8.x 模型文件不兼容。

Android 9 模型文件的命名模式為: texclassifier.[language-code].model (例如textclassifier.en.model )而不是 Android 8.x 中的textclassifier.smartselection.en.model

獲取最新的文本分類模型文件

要獲得最新的模型,可以運行以下腳本,它會更新源樹中的 TextClassifier 模型:

external/libtextclassifier/native/models/update.sh

Android 8.1 版文本分類器

Android 8.1 引入了 TextClassfier API 來實現文本分類。

TextClassificationManager tcm =
    context.getSystemService(TextClassificationManager.class);
TextClassifier classifier = tcm.getTextClassifier();
TextSelection selection = classifier.suggestSelection(...);
TextClassification classification = classifier.classifyText(...);

開發者可以設置自定義文本分類器:

tcm.setTextClassifier(customTextClassifier);

但是,如果應用程序開發人員將文本分類器設置為null ,則會為getTextClassifier()返回系統默認文本分類器。

請參閱android.view.textclassifier.TextClassifierImpl

TextView 和 WebView 使用 TextClassifier 進行智能選擇和智能文本共享功能。

文本分類器使用

圖 1. TextClassifier 用法

TextClassifier 神經網絡模型

Android 開源項目 (AOSP) 具有許多用於對文本進行分類的神經網絡模型。每個模型文件都針對一種語言進行了訓練。您可以安裝任何模型組合。模型定義在:

external/libtextclassifier/Android.mk

在設備上預安裝語言模型

您可以指定一組語言模型並將它們安裝在設備上:

# -----------------------
# Smart Selection bundles
# -----------------------

include $(CLEAR_VARS)
LOCAL_MODULE           := textclassifier.smartselection.bundle1
LOCAL_REQUIRED_MODULES := textclassifier.smartselection.en.model
LOCAL_REQUIRED_MODULES += textclassifier.smartselection.es.model
LOCAL_REQUIRED_MODULES += textclassifier.smartselection.de.model
LOCAL_REQUIRED_MODULES += textclassifier.smartselection.fr.model
include $(BUILD_STATIC_LIBRARY)

例如,在device/google/marlin/device-common.mk中。

# TextClassifier smart selection model files
PRODUCT_PACKAGES += \
    textclassifier.smartselection.bundle1

檢查已安裝的語言模塊

使用 ADB 列出目錄中的文件:

$ adb shell ls -l /etc/textclassifier
-rw-r--r-- 1 root root ... textclassifier.smartselection.de.model
-rw-r--r-- 1 root root ... textclassifier.smartselection.en.model
-rw-r--r-- 1 root root ... textclassifier.smartselection.es.model
-rw-r--r-- 1 root root ... textclassifier.smartselection.fr.model

模型更新

可以通過將新模型作為系統映像更新的一部分包含在內來更新模型,也可以通過系統API ACTION_UPDATE_SMART_SELECTION意圖觸發更新的系統組件來動態更新模型。通過廣播這個系統 API 意圖,框架能夠更新當前設置語言的語言模型。模型本身包含支持的語言和版本號,因此使用最新的適當模型。

因此,您不需要為所有語言預加載模型,因為它們可以在以後添加。如果未找到指定語言的模型文件,則文本分類返回無操作值。

兼容性測試套件測試

相關的 Android 兼容性測試套件 (CTS) 測試可在以下位置找到:

cts/tests/tests/view/src/android/view/textclassifier/cts/TextClassificationManagerTest.java

cts/tests/tests/widget/src/android/widget/cts/TextViewTest.java

  • testSmartSelection
  • testSmartSelection_dragSelection
  • testSmartSelection_resetSelection