AI基本知识讲解

2025-02-09T20:07:23+08:00 | 4分钟阅读 | 更新于 2025-02-09T20:07:23+08:00

Macro Zhao

推荐超级课程：

机器学习和深度学习

“机器学习”（Machine Learning, ML）和"深度学习"（Deep Learning, DL）是人工智能（Artificial Intelligence, AI）领域的两个重要分支，它们在理论和应用上有着紧密的联系，但也存在一些区别。

机器学习是指让计算机通过数据学习，从而获得新的知识或技能，而无需进行明确的编程。机器学习的核心是创建和使用算法来解析数据、从中学习，并做出决策或预测。

以下是机器学习的一些基本特点：

深度学习是机器学习的一个子领域，它使用了一种特殊的算法，称为神经网络，特别是深度神经网络（Deep Neural Networks, DNN）。

深度学习的关键特点是：

模型复杂性：深度学习模型通常比传统的机器学习模型更复杂，拥有更多的参数和层。
数据需求：深度学习模型通常需要更多的数据来训练，以达到较好的性能。
计算资源：深度学习模型训练通常需要更高的计算资源，尤其是在使用GPU进行并行计算时。
应用领域：深度学习在图像识别、语音识别、自然语言处理等领域取得了显著的成功，而传统的机器学习方法在这些领域可能不如深度学习有效。总的来说，深度学习可以看作是机器学习中的一种更为先进的技术，它通过构建深层次的神经网络模型来学习数据的复杂模式。而机器学习是一个更广泛的概念，包括了深度学习以及其他多种算法和技术。

LLM（Large Language Models）和RAG（Retrieval-Augmented Generation）是自然语言处理（NLP）领域中的两个重要概念。

LLM和RAG都是自然语言处理中的重要模型，LLM侧重于利用大规模预训练模型理解和生成文本，而RAG则结合了检索和生成，能够利用外部知识库来增强文本生成的质量和准确性。

下面我将分别解释这两个术语，并介绍它们的不同模型种类，包括嵌入式模型，以及各自的用途。

LLM指的是大规模语言模型，这些模型具有大量的参数，通常在数十亿到千亿级别，能够理解和生成自然语言文本。

嵌入式模型（Embedding Models）：这类模型将文本转换为固定长度的向量表示，这些向量能够捕捉文本的语义信息。例如：

Word2Vec：通过上下文预测单词。
BERT（Bidirectional Encoder Representations from Transformers）：利用双向Transformer结构来预训练语言模型。

RAG是一种生成模型，它在生成文本时结合了检索（Retrieval）和生成（Generation）两个步骤。这种模型首先从大量文档中检索与当前上下文相关的信息，然后将这些信息用于生成更丰富、更准确的文本。

检索增强型生成模型：这类模型在生成文本时，会从外部知识库中检索相关信息。例如： Facebook的RAG模型。

用途：RAG可以用于构建问答系统，特别是在需要引用外部知识库的场景中。
作用：当用户提问“量子计算机是如何工作的？”时，RAG模型会首先从互联网上检索与量子计算机相关的信息，然后将这些信息整合到生成的答案中，从而提供更全面、准确的解释。