

大家好,我是 Ai 学习的老章
刚发现一个很有意思的项目——LocoAgent,定位是 AI 驱动社交媒体 Agent,可以通过真实浏览器自动化、自主操作社交媒体账号(支持 X、LinkedIn),执行网页上的任务,如点赞帖子、撰写回复、关注用户和发布内容
深入看了下,很有料
只把 LocoAgent 当做自动发推工具,可能低估它的价值,我比较看重它「本地 Agent + 轻量模型 + 浏览器操作 + workflow」这个实现路径,把源码 Clone 下来,就是极佳学习教程
github⋅com/LocoreMind/locoagent

项目作者马诗剑大家应该可能耳熟,我之前介绍过他的 9B 小模型:一个超强 Qwen3.5-9B 微调模型,自主完成数据分析任务,消费级显卡轻松运行
马诗剑是 LocoreMind 的创始人,背景挺跨学科:从都柏林大学市场营销专业起步,到昆士兰大学信息技术,再到澳门大学数据科学硕士,还以访问学生身份在伦敦大学学院 UCL 机器人感知与学习实验室做过前沿科研
我按项目 README 跑了一遍:拉项目、配模型、抓 Hugging Face Daily Papers、挑论文、读论文、再发到 X,自动回复

安装、配置之后,实现这个流程,仅需一句话,确实方便
LocoAgent 的核心思路:不要走平台 API,不玩黑盒接口,让 Agent 真的打开浏览器,用真实 Chrome 会话去看网页、点按钮、输入内容
这点很关键
因为 X、LinkedIn 这类平台对 API、无头浏览器、异常登录都很敏感,很多自动化方案死在第一步
LocoAgent 选择的路是:让浏览器像真人一样操作,让 Agent 在上层负责判断任务怎么做
README 里给它的定位是 AI-powered social media agent,支持真实浏览器会话、平台技能、工作流引擎、操作日志、多模型供应商
我理解它想做的是一个可扩展的社交媒体操作系统
核心能力我拆成 4 个点:
/x-com 这类技能,把平台操作手册塞给 Agent,让它知道怎么浏览、点赞、回复、发帖hf-daily-papers、hf-papers-to-x 这种固定流程,不靠模型自由发挥,而是按脚本稳定执行这个方向我挺看好
社交媒体自动化最怕两件事:一是模型胡来,二是平台风控
LocoAgent 的设计至少在第一件事上做了收敛:能固定的流程固定下来,让 Agent 只做监督和决策
LocoAgent 里最值得看的不是聊天入口

而是工作流 workflow,
bun run workflow run --id hf-daily-papers
bun run workflow run --id hf-papers-to-x
bun run workflow daemon --id x-search-reply --interval 3
我跑了下 bun run workflow list,本地识别到 4 个工作流:
x-search-reply
hf-daily-papers
hf-papers-to-x
linkedin-search-reply
这几个工作流的分工也挺清楚
hf-daily-papers:打开 Hugging Face Daily Papers,抓论文标题、链接、摘要和缩略图hf-papers-to-x:抓论文后,下载缩略图,再发到 Xx-search-reply:搜索 X 上的关键词,读帖子,用模型生成回复linkedin-search-reply:同样的思路,换成 LinkedIn这就是我觉得它有潜力的地方
你可以把它看成「内容运营 SOP 的代码化」
之前是人每天打开 Hugging Face,挑论文,读摘要,写一条推文
现在是工作流每天跑一遍,只要浏览器登录态和页面结构没变,就能把动作串起来

我仔细看了下 hf-daily-papers 的定义

其实完全可以自己修改,或者创建一个新的 Workflow
直接修改项目 workflow 目录下对应的 .json .ts 文件即可

任何依靠浏览器操作的重复操作,都可以用 workflow 实现
项目拉取完成后,安装依赖:
bun install
配置上,它走 OpenAI 兼容接口时需要打开兼容模式
目录下新建 .env
CLAUDE_CODE_USE_OPENAI=1
OPENAI_API_KEY=你的 key
OPENAI_BASE_URL=你的 OpenAI 兼容地址
OPENAI_MODEL=你的模型名
SKIP_PERMISSIONS=1
#这里我用的是火山 Ark 的 OpenAI 兼容配置
再装浏览器控制工具:
npm install -g agent-browser
agent-browser --version
再启动 Chrome 远程控制:
bun run setup-chrome
脚本会复制 Chrome profile,启动 9222 端口,然后让 agent-browser 连接这个端口
成功时会看到:
Chrome CDP ready
agent-browser is ready
我启动了 Chrome 远程控制端口,然后跑 hf-daily-papers
第一次用默认配置跑,工作流打开了 Hugging Face,但默认要求论文至少 5 个 upvote,脚本没有选出论文
命令是:
bun run workflow run --id hf-daily-papers
返回结果是 partial,具体是:
{
"stepsCompleted": 1,
"stepsTotal": 3,
"papers": [],
"steps": [
{ "step": "fetch_list", "status": "success", "detail": "0 papers selected" },
{ "step": "fetch_abstracts", "status": "skipped" },
{ "step": "download_thumbnails", "status": "skipped" }
]
}
程序没崩,可能默认筛选条件太严格
我把门槛降到 0 重新跑,同一个执行器成功抓到 15 篇论文,并逐篇打开详情页补摘要
这一步我没有改默认工作流文件,而是直接调用 executor,临时传了一份配置:
bun run workflows/executors/hf-daily-papers.ts --config '{... "maxPapers":15, "minUpvotes":0 ...}'
这次返回:
Found 15 papers, selected 15
15 abstracts fetched
Data saved to workflows/.tmp/hf-2026-05-28/papers.json
所以这里要区分清楚:
.tmp最后是发 X,比较精细,它为了迎合 X 的推荐算法,还把链接自动回复到了评论区

总结
还是觉得,如果只是拿 LocoAgent 做自动发推,我觉得有点浪费
如果你正在研究本地 Agent、浏览器自动化,或者想把自己的日常信息流做成自动化工作流,这个项目值得 Clone 下来看源码
你能从里面看到真实浏览器怎么接入、平台技能怎么组织、workflow 怎么拆、日志怎么记录、模型怎么嵌进流程
有条件的话,也建议给项目点个 Star
#LocoAgent #Agent #HuggingFace #GammaWorld #X自动化