tokenizer

[美國]/ˈtəʊkənaɪzə/
[英國]/ˈtoʊkənaɪzər/

中文釋義

n.將文本分割成詞元(如單詞或短語)的程序或工具

短語搭配

tokenizer input

分詞輸入

using a tokenizer

使用分詞器

tokenizer output

分詞輸出

tokenizer library

分詞庫

tokenizer function

分詞函數

tokenizer class

分詞類

tokenizer method

分詞方法

custom tokenizer

自定義分詞器

例句

we used a fast tokenizer for efficient text processing.

我們使用了一個快速的tokenizer來進行高效的文本處理。

the tokenizer splits the text into individual tokens.

tokenizer將文本分割成單獨的token。

a subword tokenizer handles rare words effectively.

子詞tokenizer能夠有效地處理罕見詞。

the character tokenizer is simple but less effective.

字符tokenizer很簡單,但效率較低。

we need a robust tokenizer for our nlp pipeline.

我們需要一個強大的tokenizer來構建我們的NLP流水線。

the sentence tokenizer separates sentences accurately.

句子tokenizer能夠準確地分隔句子。

the word tokenizer is a common starting point.

詞tokenizer是一個常見的起點。

we compared different tokenizers for optimal performance.

我們比較了不同的tokenizer以獲得最佳性能。

the tokenizer’s output is used for feature extraction.

tokenizer的輸出用於特徵提取。

regular expressions can be used to define a custom tokenizer.

正則表達式可以用來定義一個自定義的tokenizer。

下載 App 以解鎖完整內容

想更有效率地學習單字嗎?下載 DictoGo 應用程式,享受更多單字記憶與複習功能!

立即下載 DictoGo