嵌入#
嵌入模型允许您将一段文本——一个词、一个句子、一个段落甚至整篇文章——转换为一个浮点数数组。
这个浮点数组被称为“嵌入向量”,它作为内容在多维空间中语义含义的数值表示。
通过计算嵌入向量之间的距离,我们可以识别哪些内容在语义上与其它内容“最接近”。
这可以用来构建诸如相关文章查找等功能。它也可以用来构建语义搜索,用户可以搜索一个短语,即使结果不包含任何完全相同的关键词,也能获得与该短语在语义上相似的结果。
一些嵌入模型,如 CLIP,甚至可以处理图像等二进制文件。这些可以用来搜索与其他图像相似的图像,或搜索与一段文本在语义上相似的图像。
LLM 通过插件支持多种嵌入模型。安装后,可以在命令行或通过 Python API 使用嵌入模型来计算和存储内容的嵌入,然后对这些嵌入执行相似性搜索。
请参阅 LLM 现在提供处理嵌入的工具,以获得关于嵌入的详细解释,了解它们为什么有用以及可以用它们做什么。