tokenization

[美國]/ˌtəʊkənaɪˈzeɪʃən/
[英國]/ˌtoʊkənaɪˈzeɪʃən/

中文釋義

n.將文本分割成詞元(如單詞或短語)的過程

短語搭配

tokenization process

分詞過程

tokenization step

分詞步驟

tokenization method

分詞方法

tokenization task

分詞任務

tokenization error

分詞錯誤

tokenization tools

分詞工具

tokenization stage

分詞階段

tokenization library

分詞庫

例句

the initial step involves tokenization of the text data.

初始步驟包括對文本數據進行分詞。

tokenization allows for easier analysis of the document.

分詞使得對文檔進行分析更加容易。

we performed tokenization using a standard library.

我們使用標準庫進行了分詞處理。

effective tokenization is crucial for accurate nlp.

有效的分詞對於準確的自然語言處理至關重要。

the algorithm relies on tokenization to identify keywords.

該算法依賴於分詞來識別關鍵詞。

tokenization helps in building a vocabulary for the model.

分詞有助於爲模型構建詞彙表。

whitespace tokenization is a common approach.

基於空格的分詞是一種常見的方法。

subword tokenization addresses out-of-vocabulary words.

子詞分詞解決了詞彙表外的單詞問題。

regular expression tokenization provides more control.

正則表達式分詞提供更多的控制權。

the system uses tokenization to preprocess the input.

系統使用分詞來預處理輸入。

tokenization is a fundamental step in text processing.

分詞是文本處理中的一個基本步驟。

we evaluated different tokenization strategies.

我們評估了不同的分詞策略。

下載 App 以解鎖完整內容

想更有效率地學習單字嗎?下載 DictoGo 應用程式,享受更多單字記憶與複習功能!

立即下載 DictoGo