我让 AI 自己打开浏览器、刷 Hugging Face、读论文、发 X，居然真跑通了

Ai学习的老章

发布于 2026-06-01 16:36:49

1710

文章被收录于专栏：机器学习与统计学机器学习与统计学

大家好，我是 Ai 学习的老章

刚发现一个很有意思的项目——LocoAgent，定位是 AI 驱动社交媒体 Agent，可以通过真实浏览器自动化、自主操作社交媒体账号（支持 X、LinkedIn），执行网页上的任务，如点赞帖子、撰写回复、关注用户和发布内容

深入看了下，很有料

只把 LocoAgent 当做自动发推工具，可能低估它的价值，我比较看重它「本地 Agent + 轻量模型 + 浏览器操作 + workflow」这个实现路径，把源码 Clone 下来，就是极佳学习教程

项目地址

github⋅com/LocoreMind/locoagent

项目作者马诗剑大家应该可能耳熟，我之前介绍过他的 9B 小模型：一个超强 Qwen3.5-9B 微调模型，自主完成数据分析任务，消费级显卡轻松运行

马诗剑是 LocoreMind 的创始人，背景挺跨学科：从都柏林大学市场营销专业起步，到昆士兰大学信息技术，再到澳门大学数据科学硕士，还以访问学生身份在伦敦大学学院 UCL 机器人感知与学习实验室做过前沿科研

我按项目 README 跑了一遍：拉项目、配模型、抓 Hugging Face Daily Papers、挑论文、读论文、再发到 X，自动回复

安装、配置之后，实现这个流程，仅需一句话，确实方便

简介

LocoAgent 的核心思路：不要走平台 API，不玩黑盒接口，让 Agent 真的打开浏览器，用真实 Chrome 会话去看网页、点按钮、输入内容

这点很关键

因为 X、LinkedIn 这类平台对 API、无头浏览器、异常登录都很敏感，很多自动化方案死在第一步

LocoAgent 选择的路是：让浏览器像真人一样操作，让 Agent 在上层负责判断任务怎么做

README 里给它的定位是 AI-powered social media agent，支持真实浏览器会话、平台技能、工作流引擎、操作日志、多模型供应商

我理解它想做的是一个可扩展的社交媒体操作系统

核心能力我拆成 4 个点：

真实浏览器操作：通过 Chrome 远程控制端口连接已有登录态，理论上能复用真实账号会话
平台技能系统：比如 /x-com 这类技能，把平台操作手册塞给 Agent，让它知道怎么浏览、点赞、回复、发帖
工作流引擎：像 hf-daily-papers、hf-papers-to-x 这种固定流程，不靠模型自由发挥，而是按脚本稳定执行
操作日志：记录已经做过的动作，避免重复点赞、重复发同一篇论文

这个方向我挺看好

社交媒体自动化最怕两件事：一是模型胡来，二是平台风控

LocoAgent 的设计至少在第一件事上做了收敛：能固定的流程固定下来，让 Agent 只做监督和决策

工作流

LocoAgent 里最值得看的不是聊天入口

而是工作流 workflow,

bun run workflow run --id hf-daily-papers
bun run workflow run --id hf-papers-to-x
bun run workflow daemon --id x-search-reply --interval 3

我跑了下 bun run workflow list，本地识别到 4 个工作流：

x-search-reply
hf-daily-papers
hf-papers-to-x
linkedin-search-reply

这几个工作流的分工也挺清楚

hf-daily-papers：打开 Hugging Face Daily Papers，抓论文标题、链接、摘要和缩略图
hf-papers-to-x：抓论文后，下载缩略图，再发到 X
x-search-reply：搜索 X 上的关键词，读帖子，用模型生成回复
linkedin-search-reply：同样的思路，换成 LinkedIn

这就是我觉得它有潜力的地方

你可以把它看成「内容运营 SOP 的代码化」

之前是人每天打开 Hugging Face，挑论文，读摘要，写一条推文

现在是工作流每天跑一遍，只要浏览器登录态和页面结构没变，就能把动作串起来

自定义工作流

我仔细看了下 hf-daily-papers 的定义

其实完全可以自己修改，或者创建一个新的 Workflow

直接修改项目 workflow 目录下对应的 .json .ts 文件即可

任何依靠浏览器操作的重复操作，都可以用 workflow 实现

安装、配置、实测

项目拉取完成后，安装依赖：

bun install

配置上，它走 OpenAI 兼容接口时需要打开兼容模式

目录下新建 .env

CLAUDE_CODE_USE_OPENAI=1
OPENAI_API_KEY=你的 key
OPENAI_BASE_URL=你的 OpenAI 兼容地址
OPENAI_MODEL=你的模型名
SKIP_PERMISSIONS=1

#这里我用的是火山 Ark 的 OpenAI 兼容配置

再装浏览器控制工具：

npm install -g agent-browser
agent-browser --version

再启动 Chrome 远程控制：

bun run setup-chrome

脚本会复制 Chrome profile，启动 9222 端口，然后让 agent-browser 连接这个端口

成功时会看到：

Chrome CDP ready
agent-browser is ready

我启动了 Chrome 远程控制端口，然后跑 hf-daily-papers

第一次用默认配置跑，工作流打开了 Hugging Face，但默认要求论文至少 5 个 upvote，脚本没有选出论文

命令是：

bun run workflow run --id hf-daily-papers

返回结果是 partial，具体是：

{
  "stepsCompleted": 1,
  "stepsTotal": 3,
  "papers": [],
  "steps": [
    { "step": "fetch_list", "status": "success", "detail": "0 papers selected" },
    { "step": "fetch_abstracts", "status": "skipped" },
    { "step": "download_thumbnails", "status": "skipped" }
  ]
}

程序没崩，可能默认筛选条件太严格

我把门槛降到 0 重新跑，同一个执行器成功抓到 15 篇论文，并逐篇打开详情页补摘要

这一步我没有改默认工作流文件，而是直接调用 executor，临时传了一份配置：

bun run workflows/executors/hf-daily-papers.ts --config '{... "maxPapers":15, "minUpvotes":0 ...}'

这次返回：

Found 15 papers, selected 15
15 abstracts fetched
Data saved to workflows/.tmp/hf-2026-05-28/papers.json

所以这里要区分清楚：

默认 Workflow 没改
我为了演示，把执行器临时参数放宽了
生成的数据文件保存到了本地 .tmp

最后是发 X，比较精细，它为了迎合 X 的推荐算法，还把链接自动回复到了评论区

总结

还是觉得，如果只是拿 LocoAgent 做自动发推，我觉得有点浪费

如果你正在研究本地 Agent、浏览器自动化，或者想把自己的日常信息流做成自动化工作流，这个项目值得 Clone 下来看源码

你能从里面看到真实浏览器怎么接入、平台技能怎么组织、workflow 怎么拆、日志怎么记录、模型怎么嵌进流程

有条件的话，也建议给项目点个 Star

#LocoAgent #Agent #HuggingFace #GammaWorld #X自动化

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-05-29，如有侵权请联系 cloudcommunity@tencent.com 删除

浏览器

本文分享自机器学习与统计学微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度