构建智能知识库 - 知识获取:Obsidian Web Clipper 的 AI 自动化流程
本文重点讲解知识获取阶段的 AI实践
。通过 Obsidian Web Clipper
和 DeepSeek
平台,实现自动提取 文章标签
、智能总结关键点
、生成价值评价
等功能。
文章提供了详细的实践指南,包括插件下载、基础配置、解释器配置等步骤,以及 Android 移动端的实操示例。
知识库建设分 4 个阶段(知识获取
→知识整理 →知识连接 →知识输出)。
graph LR B[知识获取] --> C[知识整理] --> D[知识连接]--> E[知识输出]
我们知识获取阶段用哪些工具,如何使用 AI 来提效?
提取内容
我们收藏一篇文章稍后阅读,起码需要了解以下内容才能支撑我们制作一张卡片笔记。
- 一句话总结 + 关键点提取
- 生成评价,突出其价值和适用场景
- 提取文章标签:限定领域的标签,比如软件开发
在没有 AI 之前,我们可能需要通读过后才能得出结论,但现在收藏后立刻就能提取上面的信息。
实践指南
插件下载
obsidian web clipper 是浏览器插件的形式。 插件安装:下载地址,支持 chrome,firefox,edge,safri 等主流浏览器。
基础配置
- 新建模板配置用来将网页保存为 markdown。这里比较重要的几个设置包括笔记存放的
vault
和文件夹
- 新增一个
未归档
的标签
,这样在 obsidian 里面可以按未归档来查询整理
解释器配置
什么是解释器
解释器是一个为 obsidian web clipper 的专门设计的功能,允许用户使用自然语言与网页交互。解释器帮助用户捕获和修改采集的内容并保存到 Obsidian。例如:
- 提取特定文本片段。
- 总结或解释信息。
- 将文本翻译成另一种语言。
本质上这是一个 RAG 程序,上下文是解释器用于处理提示的页面,上下文越小,解释器运行越快。
解释器模型配置
- 在 DeepSeek 官网开通 DeepSeek-api服务,创建 1 个 API key
- 在
Obsidian Web Clipper
插件配置页,添加模型供应商,添加DeepSeek
模型;
采集内容配置
配置解释器,定制提示词,采集时生成摘要
建议配置 2 个模板,1 个启用 AI,1 个不启用
解释器上下文使用默认即可,采集特定的网站可以定制 html 选择器,减少 token 消耗
笔记内容配置
未归档,{{"3个标签,逗号分隔"}}
# {{"本文的中文标题"}}
{{"本文的中文摘要,1句话提取核心内容,以及3个关键点,用有序列表展示"}}
{{"本文的简短评价,突出其价值和适用场景"}}
---
{{content}}
移动端
我使用的是 android 系统,安装好 obsidian 和 firefox 浏览器,然后火狐浏览器开启账号同步,在 obsidian clipper 中导入配置
导入电脑上的配置
文章高亮示例
采集示例
点击添加到 Obsidian,markdown 会自动存储到 vault 对应的目录。 手机端检测到文件更新后,liveSync 插件会自动同步,然后就可以进入知识整理阶段了。
📌 总结
本文聚焦知识库建设最关键的 知识获取
阶段,介绍如何使用 Obsidian 官方的 Obsidian Web Clipper
来实现数据采集和 AI 智能提取。
之前分享过使用 miniflux rss 阅读 来定制自己的阅读源,我们在使用 miniflux 阅读时,也可以直接用 Obsidian Web Clipper
进行剪藏。