tokenization

[美]/ˌtəʊkənaɪˈzeɪʃən/
[英]/ˌtoʊkənaɪˈzeɪʃən/

释义

n.将文本分割成词元(如单词或短语)的过程

短语搭配

tokenization process

分词过程

tokenization step

分词步骤

tokenization method

分词方法

tokenization task

分词任务

tokenization error

分词错误

tokenization tools

分词工具

tokenization stage

分词阶段

tokenization library

分词库

例句

the initial step involves tokenization of the text data.

初始步骤包括对文本数据进行分词。

tokenization allows for easier analysis of the document.

分词使得对文档进行分析更加容易。

we performed tokenization using a standard library.

我们使用标准库进行了分词处理。

effective tokenization is crucial for accurate nlp.

有效的分词对于准确的自然语言处理至关重要。

the algorithm relies on tokenization to identify keywords.

该算法依赖于分词来识别关键词。

tokenization helps in building a vocabulary for the model.

分词有助于为模型构建词汇表。

whitespace tokenization is a common approach.

基于空格的分词是一种常见的方法。

subword tokenization addresses out-of-vocabulary words.

子词分词解决了词汇表外的单词问题。

regular expression tokenization provides more control.

正则表达式分词提供更多的控制权。

the system uses tokenization to preprocess the input.

系统使用分词来预处理输入。

tokenization is a fundamental step in text processing.

分词是文本处理中的一个基本步骤。

we evaluated different tokenization strategies.

我们评估了不同的分词策略。

下载 App 解锁完整内容

想更高效学习单词?下载DictoGo App,享受更多词汇记忆与复习功能!

立即下载 DictoGo