技术小白的福音:AI 语义搜索本地开箱即用方案

大家好,我是麦冬。

上次聊完 AI 知识库和语义搜索 后,不少朋友都说,理论虽然很酷,但一想到要折腾 Ollama 这样的本地服务就望而却步。就像粉丝 Xylon 留言说的:"想用,但不知道怎么配置。"

如果这也是你的痛点,那么今天这篇文章就是为你准备的。

现在,告别折腾的时候到了。

InfioCopilot 插件的 0.7.1 新版,直接将本地嵌入模型 LocalProdver (bge-micro-v2) 内置了进去。这意味着:

你可以在 Obsidian 中即刻拥有强大的语义搜索功能,无需任何外部服务,真正实现开箱即用。

对于痴迷于用 Obsidian 构建第二大脑的我们来说,这无疑是一次巨大的体验飞跃。我亲测,bge-micro-v2 模型在笔记搜索场景下效果相当出色。

它是如何实现的?

你可能好奇,一个小小的插件是如何做到这一切的。这背后有几个关键技术:

  • 核心驱动:使用了 transformers.js 库,甚至可以利用 WebGPU 进行加速,确保流畅体验。
  • 模型格式:模型文件采用 ONNX(开放神经网络交换格式),它轻量、高效,运行时你几乎感觉不到它的存在。
  • 默认模型:内置的 bge-micro-v2 模型仅有 384 维,非常精悍。请注意,由于维度降低,你需要将 RAG 配置中的分块大小从过去的 1000 调整为 500,以获得最佳效果。
  • 更多选择:系统内置了十几种小型模型,如 nomicbgejina 等系列。你随时可以在配置中切换,一键重建索引,系统会自动完成新模型的下载和部署。

bge-micro-v2 是一个 sentence-transformers 模型,它能将句子和段落转化为一个 384 维的向量。正是这些向量,让电脑拥有了理解文字深层含义的能力,从而实现精准的语义搜索。

语义模型配置

现在,我们来看看如何配置。重点关注 嵌入模型聊天模型

嵌入模型 设置为 LocalProdver,你就开启了本地化 AI 之旅。

RAG 分块配置

接着,调整 RAG(检索增强生成)的参数。这一步是为了让 AI 更好地"阅读"和"理解"你的笔记。

如前所述,关键是把 分块大小 改成 500。你还可以点击 测试模式,查看哪些文件将被纳入 AI 的知识体系。

向量构建

配置完成后,只需一步,即可为你的知识库注入灵魂。

打开 Obsidian 的指令面板,选择 infio copilot: 重建整个 Vault 索引

本地模型的构建速度非常快。我测试了 600 个文件,大约 5000 个知识块,5 分钟左右就完成了。一杯咖啡的时间,你的知识库就已焕然一新。

像与人交谈一样搜索笔记

新版 infio 引入了 工作区 (workspace) 的概念,这是一个极其有用的功能。你可以将特定的文件夹、标签或文件限定为一个独立的工作区。

我的建议是,为不同的主题建立少量、精准的工作区,而不是对整个库进行无差别搜索。这不仅效果更好,也促使我们用 PARAMOC 等方法论,更好地组织自己的笔记体系。

工作区配置

例如,我为自己的 卡片盒极客工具 资料库和带有 #daily 标签的日常待办建立了一个工作区。

实践:语义搜索与 RAG 对话

配置好工作区后,真正的魔法开始了。

当我搜索一个模糊的概念,比如:常青笔记的实践方法,它能精准地找到相关的笔记,而不是仅仅匹配关键词。

更进一步,我们可以进行 RAG 对话。比如我提问:常青笔记有哪些技巧可以直接实践

infio 会首先在我的笔记中进行语义搜索,找到最相关的内容,然后让 AI 大模型基于这些私有知识进行总结和回答。

下面是 AI 的"思考过程":

Markdown

用户想了解常青笔记的实践技巧。我首先应该在现有的笔记中查找有关常青笔记的信息,看看是否已经有相关的技巧总结。如果找到相关笔记,我会提取其中的关键信息,整理成易于实践的步骤或建议。如果信息不足,我会考虑使用网络搜索来补充,并确保提供的信息具有实践性。考虑到用户是中文用户,我需要用中文组织这些技巧。
 
* Goal 1: 使用语义搜索查找与常青笔记相关的笔记。 
* Goal 2: 从找到的笔记中提取实践技巧。 
* Goal 3: 如果笔记中的信息不足,使用网络搜索补充信息。 
* Goal 4: 整理实践技巧,确保步骤清晰、易于操作,并用中文表达。

最终,它会像一个真正的助理一样,为你生成条理清晰的回答。

总结

Google NotebookLM 的核心理念是:Think Smarter, Not Harder(巧思胜苦干),并将其定位为 Your Personalized AI Research Assistant(你的个性化研究助理)

曾几何时,我们以为这样的能力需要依赖大型云服务才能实现。但现在,借助 infio 这样强大的插件,我们完全可以在自己熟悉的 Obsidian 环境里,拥有一个不受服务商绑定的、完全私有的个性化 AI 学习助理

Obsidian 天然的本地化优势,远比任何一句 我们非常重视您的隐私权 的承诺,都来得更安心、更可靠。

希望这篇指南能帮你轻松迈入 Obsidian 的 AI 新时代。

更多延伸阅读,按需探索:

  1. 语义搜索的科普:king - man + woman ≈ queen
  2. 构建个人知识库-十年知识管理的工具选型心得
  3. 基于常青笔记方法论构建自己的知识体系