跳到主要内容

一个人 + 一个 AI Agent,一天能干多少活?

· 阅读需 7 分钟
一介布衣
全栈开发者

一个人 + 一个 AI Agent,一天能干多少活?今天我做了一个实验。

背景

我日常管理一个 AI 内容创作平台的团队,同时运营一个工业设备交易平台(澎湃易拍)。工作内容横跨技术、产品、运营、内容创作多个领域。从今年开始,我把大量日常工作交给了 AI Agent(Hermes),通过飞书对话驱动,看看一天下来到底能产出多少东西。

今天是 4 月 29 日,以下是这一天的真实协作记录。

上午:数据查询 + 调查问卷

飞书调查问卷(10 分钟完成)

一句话需求:"帮我在飞书平台生成一个调查问卷,关于个人 C 端用户是否能接受闲置物品拍卖,控制在 10 个问题以内。"

Agent 做了什么:

  • 调用飞书多维表格 API 创建表格
  • 自动设计 10 道题(单选、多选、开放题混合)
  • 创建表单视图并配置每道题的标题、说明、必填状态
  • 开启公开分享(任何人可填写,无需登录飞书)
  • 把填写链接发到飞书

从说需求到拿到可分发的问卷链接,全程大约 10 分钟。如果人工去飞书后台一个个配字段,至少半小时。

数据库查询 + 风险分析

"帮我查库,前两周共有多少笔资金往来记录。"

Agent 连接了 UAT 环境的 MySQL 数据库(epad-pc + epad-competition),跨库查了三张表:

数据源结果
钱包流水(competition_deposit_flow)8 笔
服务费订单(competition_fee_order)0 笔
保证金流水(competition_project_deposit_flow)0 笔

结果用飞书消息卡片(表格格式)直接推送,不需要我打开任何后台系统。

后来我又让它查了标的发布记录(27 个),并且做了一份完整的资金风险分析报告——5 大风险点 + 6 条审查建议,用红色警告卡片发到飞书。这种交叉分析如果人工做,至少需要 2 小时翻数据库 + 写报告。

下午:内容创作全家桶

微信文章转播客(20 分钟)

给了一个微信公众号链接(智东西的 DeepSeek-V4 降价报道),需求:"提取核心内容,制作成主持人和嘉宾的采访对话,生成音频播客发飞书。"

Agent 的流程:

  1. 用浏览器工具打开公众号文章,提取全文
  2. 改写成 18 轮主持人 + 嘉宾对话脚本
  3. 调用本地 sound2sound API 生成双人播客音频(女主持 + 男嘉宾)
  4. WAV 转 MP3,通过飞书文件 API 发送

生成了 3 分 11 秒的播客,音质相当自然。后来我还让它:

  • 用我发的一段语音克隆了嘉宾音色,重新生成
  • 把主持人和嘉宾都换成四川方言版

三个版本的播客,从普通话到克隆音色到四川话,全程不到一小时。

100 万字小说大纲 + 开篇

"帮我生成一部小说《霸道总裁爱上保洁阿姨》的都市爱情爽文,预计 100 万字左右。"

Agent 直接输出了:

  • 6 卷 180 章的完整大纲(每卷有主题、章节范围、剧情摘要)
  • 核心人物关系图
  • 第一回前 1000 字的正文

第一回写得挺有意思的——苏晚棠误闯总裁私人电梯,被陆衍深抓个正着。节奏紧凑,对话有张力,网文味拿捏到位。

B 站视频解析 + 小红书文案

丢了一个 B 站链接(62.7 万播放的 AI 童年回忆视频),需求:"解析视频内容,提取核心要点,给我生成小红书营销文案。"

Agent 输出了 5 个版本的小红书文案:

版本风格
情感共鸣型主打破防泪目
种草安利型带教程步骤
热点追踪型数据分析向
互动引导型评论区挑战玩法
账号运营型拆解爆款逻辑

每版都有标题、正文、话题标签,直接可以发。

视频剪辑

还帮我处理了一段 8 秒的视频:

  • 下载 Pixabay 免费钢琴 BGM
  • 原音 60% + BGM 40% 混音
  • PIL 生成中文字幕 PNG + ffmpeg overlay 叠加
  • 转竖版 1080x1920(毛玻璃背景填充)

因为 macOS 的 ffmpeg 没有编译 subtitles 滤镜,Agent 自动切换到了 PIL 渲染 + overlay 的方案。这种随机应变的能力是最值钱的。

统计报表 HTML

"帮我查库,把资金往来数据生成一个高端大气上档次的 HTML 统计报表。"

Agent 用 taste-skill(高端 UI 审美技能)生成了一个完整的数据可视化页面:

  • 4 个 KPI 卡片(总笔数、总金额、操作人、活跃天数)
  • 按操作人分布的柱状图
  • 按金额级别的环形图
  • 8 笔交易的完整明细表
  • 按项目汇总的三栏卡片

用了 Outfit + JetBrains Mono 字体,Zinc 配色,带入场动画。纯 HTML 单文件,浏览器打开即用。

协作痛点(诚实记录)

一天下来也不是完全顺利,主要有几个问题:

  1. Agent 超时卡死:复杂任务(特别是 delegate_task)容易触发 30 分钟的 gateway 超时限制,前面的工作全白费
  2. 搜索引擎反爬:百度几乎每次都触发验证码,只能用 Bing 或直接调 API
  3. 声音克隆选错文件:第一次克隆用了错误的语音文件,需要人工指出才修正
  4. 飞书授权报错:应用没开网页能力,点链接报 code:200340

这些问题不致命,但确实影响效率。好在 Agent 能自我修正——报错后换方案,超时后重试。

一天的产出清单

序号产出耗时
1飞书调查问卷(10 题,公开链接)10 分钟
2天津限行查询2 分钟
3协作痛点分析报告(6 大类)5 分钟
4UAT 数据库资金流水查询 + 飞书卡片3 分钟
5飞书多维表格统计报表8 分钟
6高端 HTML 数据可视化报表5 分钟
7100 万字小说大纲 + 第一回开篇3 分钟
8微信文章转播客(普通话版)20 分钟
9播客(克隆音色版)15 分钟
10播客(四川方言版)15 分钟
11B 站视频解析 + 5 版小红书文案5 分钟
12视频剪辑(BGM + 字幕 + 竖版转换)8 分钟
13标的发布记录查询(27 个)3 分钟
14资金风险分析报告(5 大风险 + 建议)5 分钟
15这篇博客文章5 分钟

15 项产出,总计约 2 小时的人机交互时间。

如果全靠人工做这些事(查数据库写 SQL、设计问卷、写脚本生成音频、剪视频、写文案、做数据可视化),保守估计需要 2-3 个工作日。

写在最后

AI Agent 不是万能的。它会卡死、会选错文件、会被反爬拦截。但它的价值在于把 80% 的重复劳动自动化了,让人可以专注在 20% 的决策和创意上。

我说"帮我查库",它就去连数据库、写 SQL、格式化结果、发飞书卡片。我说"生成播客",它就去抓文章、写脚本、调 TTS、转格式、发文件。我不需要打开任何后台系统,不需要写任何代码,不需要切换任何工具。

一个飞书对话窗口,就是我的整个工作台。

这不是未来,这是今天。