一个自动音频转写 + 总结 + 整理 B 站视频的 n8n workflow

流程图全览

小红书-n8n-竖版正文1

输入链接 ➛ 提取 BV 号 ➛ 获取数据 ➛ 推送数据 ➛ 下载、压缩音频 ➛ 调用远程 Whisper 转录文字 ➛ 整理总结 ➛ 更新送至多维表格、推送通知

1. 分析链接

小红书-n8n-竖版正文2

使用 Telegram Trigger,创建 Telegram bot 用于接收用户信息,我把我的所有 Telegram bot 都拉到一个群里,然后通过@ 来指定机器人工作。Telegram Trigger 后面的 IF 节点就是用来判断接收到的信息里有没有该机器人的 ID,若有,才会进行后面的步骤。

下一步是从用户输入的信息中提取 B 站链接和 BV 号,BV 号是用 js 和正则表达式提取。提取 BV 号是为了后面方便给下载的音频命名等工作。

包括这里的代码在内,后面所有的涉及到写代码、执行的命令,我都是问的 AI,我自己并不会写……所以在这里也就不展示具体的代码了,能够实现你的目的就行。

后接一 Set 节点,固定住 BV 号,方便后续调用。

2. 抓取和推送数据

小红书-n8n-竖版正文3

使用 B 站的官方 api 抓取数据,其中 BV 号源于上一步。官方 api 需要自己上网查一下,GitHub 上有人整理过。或者你也可以直接用 HTTP Request GET 来获取,然后自己清洗数据。

后面就是用一个 Set 节点整理数据,方便后续调用;然后用 tg 节点,先把播放量等数据推到 tg 聊天框里。这主要是为了告诉用户 workflow 已经开始执行了。

3. 下载与转换格式

小红书-n8n-竖版正文4

使用 yt-dlp 抓取该 B 站视频的音频,然后调用ffmpeg 压缩获取的音频,方便后续传输。这里压缩的音质要尽可能低。

后面使用节点读取压缩好的音频,准备传输给外部 Whisper。

4. AI 转写与整理

小红书-n8n-竖版正文5

把前面压缩好的音频文件传输过来,调用本地部署的 Whisper 转写。

这里使用 tailscale 为本地 Whisper 和云服务器 n8n 建立连接。

转写好后,用两个 AI 节点,一个负责添加标点,一个负责总结归纳该视频的内容。注意,一定要让这两个 AI 输出的内容没有回车(也就是/n),这样才能写入飞书多维表格。 这里多解释一下,为什么我是调用 Whisper 转写。

B 站的 up 主通常不会上传软字幕,所以就需要自己转写。我的 n8n 是部署在云服务器上的,性能比较孱弱,肯定跑不动 Whisper,所以我把 Whisper 放到 NAS 上,并用 tailscale 组网调用。

NAS 上的 Whisper 我是用的 small 模型来转写。我试了几篇,正确率还可以。因为我大部分时候并不会直接阅读正文,错误率高点没关系,而且后面还有 AI 节点来添加标点和纠正错别字,所以就没必要跑 medium 或者 large 模型来转写。

5. 填写飞书多维表格并推送完成通知

小红书-n8n-竖版正文6

先建立飞书多维表格,厘清自己想整理的项目,然后在这一步直接推送、自动填写到多维表格中。

注意多维表格 fields 的填写规范,具体见飞书的 api 文档,有示例,并不复杂。

最后给 tg 推一个完成的通知。我在这一步里只推了总结内容,没有推送 Whisper 听写的逐字稿。