John: 2025-4-9大语言模型(LLM)是让“语言”变成“数学”的工具。它的核心能力,是把我们日常说的自然语言,
大语言模型:让语言变得“可计算”
John: 2025-4-9
大语言模型(LLM)是让“语言”变成“数学”的工具。它的核心能力,是把我们日常说的自然语言,转化为可以被计算机理解和处理的数字。
这个过程大致分两步:
- Tokenization(分词):先把一段文字拆解成一个个“词片”或“字”,比如“我爱你”会被切成 ["我", "爱", "你"],然后这些词片会被转成编号。
- 向量化(Vectorization):接着,这些编号会被转换成一串串的数字向量,就像是文字的“数学表达”。模型通过计算这些向量之间的关系,来理解句子、回答问题、甚至创作文本。
简单来说,LLM 就是语言的“数字化+可计算化”的结果。它让本来模糊、抽象的语言信息,变成了能被神经网络处理的数字,从而实现理解、生成和交流。
Comments (0)
No comments