← back
artifacts/process-summary.md
VPS访问小红书受限解法
workspace
content
# VPS访问小红书受限解法 ## 状态 - 来源:Hermes `weixin` session - Session ID:`20260703_055856_2f2594d3` - 起止时间:2026-07-03 05:58:56 → 2026-07-03 08:07:48 - 消息数:61 - 工具调用数:32 - 主要工具:hindsight_recall, web_search, terminal, search_files, skill_view, read_file, tool_slimmer_request_full_tools, session_search, patch ## 原始意图 帮我想个解决一个需求,我发现中国大陆的小红书是一个本地经验平台,他的有效通常不在帖子,而是帖子下方的评论区。比如我去医院拔智齿,搜索相关话题,地区+医院名称+xxx医生/xxx功能(拔智齿) 然后通常会有很多网友亲身经历,避雷或者多个推荐的医生。这能很好的帮我去筛选资源。挂号到一些很不错的医生。(比如我原先选择的医生,一搜才知道他的口碑非常差,技术也比较差。有负面信息避雷贴,当然这个过程中,评论区也找到了不少推荐贴) 虽然有不少广告,但是广告托的特征和正常网友还是有明显区别(至少广告号点进去账号主页,发现全都是清一色的推销帖子或者该话题的测评贴,这种就是非正常账号) 因为vps端访问小红书,好像会被限制,你有什么好的解决方案吗?或者社区,开源项目有什么最新策略可以借鉴? ## 最近一次用户方向 我想这个采集的,本地有没有浏览器插件可以做呢?自动采集完,数据再清洗一下 ## 最近一次助手结论 / 交付 有,Boss。浏览器插件路线是存在的,而且比“本地 Playwright 脚本”更贴近你的想法。 我刚查了几个开源方向,比较值得看的有这几类: ## 1. 首选参考:`xpzouying/x-mcp` GitHub:`xpzouying/x-mcp` 定位:**小红书 MCP 浏览器插件版** Stars:约 389 特点: - Chrome 插件 - 复用你本地浏览器的小红书登录态 - 所有操作在浏览器里可见 - 可以让 AI/MCP 控制浏览器执行搜索、读取、发布等动作 - 官方描述里强调:无异地登录、环境异常风险更低 它是 `xiaohongshu-mcp` 作者做的浏览器插件增强版。这个方向最符合你说的: > 本地浏览器模拟真人点击浏览,自动采集完,再清洗数据。 缺点是它偏 MCP 自动化助手,不一定天然就是“批量导出评论清洗工具”,但作为底座很合适。 --- ## 2. 可参考:`aicu-icu/xhs-mcp-server` GitHub:`aicu-icu/xhs-mcp-server` 定位:浏览器 + 插件 / loader 启动的小红书 MCP 服务 Stars:约 176 它的 README 明确写: - 浏览器 + 插件即可 - 打开小红书网页 - 通过 loader/userscript 启动 - 获取 MCP 服务地址使用 它自己也提示了关键风险: > 小红书接口请求频繁或 `xsec_token` 参数不匹配会触发风控,导致账号异常退出。 这个项目可以参考,但我不会把它作为首选,因为它更像“快速接入 MCP”的轻量方案,成熟度和安全边界需要验证。 --- ## 3. 辅助工具:`login-state-reader` GitHub:`yxwxl/login-state-reader` 定位:浏览器插件 + Python 桌面桥接工具 用途:读取真实 Chrome/Edge 登录态,导出 Cookie Header / Playwright storage_state 它不是小红书采集器,但很有用:可以把你本地浏览器登录态安全地转给本地采集脚本,不用在 VPS 或微信里传 cookie。 适合做: ```text 本地 Chrome 登录小红书 → 插件读取登录态 → 本地采集器使用 → 数据导出 ``` --- ## 4. 泛平台方案:`Agent-Reach` GitHub:`Panniantong/Agent-Reach` Stars:约 49k 定位:让 Agent 读取 Twitter、Reddit、B站、小红书等平台 它的思路是: > 需要登录的平台,优先让用户在自己的浏览器里登录;OpenCLI 复用 Chrome 登录态;Cookie 只存在本地。 这个方向很适合作为“本地数据采集网关”,但它不是小红书专用采集器。 --- ## 我的判断 如果你想要“浏览器插件 + 自动采集 + 清洗”,我建议路线是: ```text x-mcp / 浏览器插件 → 本地 Chrome 真实登录 → 低频搜索和打开笔记 → 导出原始 note/comment 数据 → 本地清洗脚本 → Hermes 做口碑分析 ``` 而不是: ```text VPS headless 爬虫 ``` --- ## 推荐架构 ### 本地插件层 负责: - 打开小红书 - 搜索关键词 - 打开笔记 - 展开评论 - 采集正文、评论、作者、点赞、时间、链接 - 本地保存 JSON ### 本地清洗层 负责: - 去重 - 过滤空评论 - 合并同一医生/医院/项目别名 - 标注疑似广告号 - 生成干净 Markdown / JSON ### Hermes 分析层 负责: - 正负面归类 - 推荐/避雷医生提取 - 证据链整理 - 广告号识别 - 输出最终决策报告 --- ## 我建议先做的 MVP 不要一上来做大而全插件。先做一个保守版: ```text 输入: 汕头 + 某医院 + 拔智齿 采集: 搜索结果前 10 条 每条评论前 30 条 作者主页只抓标题摘要,不深挖 输出: xhs_r ...[truncated 410 chars] ## 过程文件 / 产物路径 - `/root/aliyun-bailian-proxy/SKILL.md` - `/root/hermes-agent-configuration/references/xhs-mcp-http-api.md` - `/root/hermes-agent-configuration/references/aliyun-model-proxy.md` - `/root/hermes-agent-configuration/references/xhs-mcp-setup.md` - `/root/hermes-agent-configuration/references/xhs-cli-alternatives.md` - `/root/browser-data-extraction/references/xiaohongshu-extraction.md` - `/root/social-media/xiaohongshu-mcp/SKILL.md` - `/root/.xiaohongshu-cli/cookies.json` - `/root/.xiaohongshu-cli/search_sessions.json` - `/root/hermes_config_backups/20260624_223531_before_remove_cliproxyapi/CONFIG_OWNERSHIP.md` - `/root/hermes_config_backups/20260623_175247_before_cliproxyapi_aux_fast/CONFIG_OWNERSHIP.md` - `/root/.hermes/scripts/temp_oauth_connect_proxy.py` - `/root/.hermes/temp-oauth-proxy/proxy.py` - `/root/.hermes/xhs-data/cookies.json` - `/root/check_xhs_config.py` - `/root/aliyun-model-proxy-deploy.md` - `/root/test_xhs_mcp.py` - `/root/test_xhs_simple.py` - `/root/devops/proxy-client-configuration/SKILL.md` - `/root/devops/caddy-reverse-proxy/SKILL.md` - `/root/marketing_management_public_case_pool.md` - `/root/hermes-skills-overview.html` - `/root/racknerd-final.yaml` - `/root/import_sessions_to_hindsight.py` - `/root/devops/hermes-dashboard-maintenance/SKILL.md` - `/root/.hermes/bin/xhs-mcp` - `/root/.hermes/xhs-data` - `/root/.cache/rod/browser/chromium-1321438/chrome` - `/root/.cache/rod/browser/chromium-` - `/root/social-media/xiaohongshu-mcp` - `/root/.xiaohongshu-cli` - `/root/.hermes/config.yaml` - `/root/.hermes/scripts/product-hunt-daily.py` - `/root/.hermes/skills/browser-data-extraction` - `/root/devops/sing-box-ops/SKILL.md` - `/root/marketing_management_public_case_deepened.md` - `/root/book_knowledge/source/自媒体与内容生产/马督工自媒体教程/08-第六讲` - `/root/book_knowledge/source/自媒体与内容生产/马督工自媒体教程/04-第二讲` - `/root/book_knowledge/source/商学院案例库/中欧商学院案例合集/6.新质供应链_来自大湾区制造业的启示.md` - `/root/book_knowledge/source/商学院案例库/中欧商学院案例合集/12.领导力.md` - `/root/book_knowledge/source/商学院案例库/中欧商学院案例合集/7.战略模拟与行为反思.md` - `/root/book_knowledge/source/商学院案例库/中欧商学院案例合集/13.产业互联网平台化战略-产业重做一遍的方法论.md` - `/root/book_knowledge/source/商学院案例库/中欧商学院案例合集/3.供应链战略与决策分析.md` - `/root/book_knowledge/source/商学院案例库/中欧商学院案例合集/9.创新与创业.md` - `/root/book_knowledge/source/商学院案例库/中欧商学院案例合集/11.财务报告.md` - `/root/book_knowledge/source/商学院案例库/中欧商学院案例合集/1.产业发展与竞争分析.md` - `/root/ceibs_ceo_succession_v3_selfmedia.md` - `/root/ceibs_ceo_succession_selfmedia.md` - `/root/ceibs_ceo_succession_two_versions_comparison.md` - `/root/ceo_succession_public_cases_madugong_version.md` - `/root/.hermes/skills/book-derived/decode-od/chapters/ch19.md` - `/root/ceo_succession_original_case_public_audit.md` - `/root/ceo_succession_case_public_audit/original_a_version.txt` - `/root/ceo_succession_source_chain_case_pool.md` - `/root/marketing_public_case_replacement_pool.md` - `/root/ceo_succession_public_case_source_expansion.md` - `/root/.hermes/skills/writing-skills/public-case-source-replacement/SKILL.md` - `/root/ceibs_self_media_articles/中欧商学院案例_营销管理_自媒体稿.md` - `/root/.hermes/skills/book-derived/decode-od/chapters/ch18.md` - `/root/.hermes/skills/book-derived/madugong-self-media/SKILL.md` - `/root/weixin_file_archive/2026/07/01/014812_99bcc773_【话题】为什么创始人明明想交班` - `/root/marketing_management_public_case_original_vs_rewrite.md` - `/root/backups/runs/20260701_033059` - `/root/.config/rclone/rclone.conf` - `/root/.hermes/.env` - `/root/.hermes/temp-oauth-proxy/creds.env` - `/root/project-a` - `/root/.hermes/skills/media-case-map/SKILL.md` - `/root/.hermes/skills/collaborative-media-case-map/SKILL.md` - `/root/media_case_map_professional/output/专业人才陈皮书_自媒体案例地图与知识型稿件.md` - `/root/cstd_casebook/final/专业人才陈皮书_道法术器增补版.pdf` - `/root/cstd_casebook/final/CSTD八类原始转写稿_MD格式_按分类.zip` - `/root/media_case_map_professional/professional_pdf.txt` - `/root/media_case_map_professional/output/send/专业人才陈皮书_自媒体案例地图_参考内训师样式.html` - `/root/media_case_map_professional/output/send/专业人才陈皮书_知识型自媒体稿件.md` - `/root/.hermes/skills/social-media/xiaohongshu-mcp/scripts/inject-cookie.py` - `/root/.hermes/skills/social-media/xiaohongshu-mcp/templates/xhs-mcp.service` - `/root/.hermes/scripts/start-xhs-mcp.sh` - `/root/.hermes/hindsight/config.json` - `/root/docker-compose.yml` - `/root/hindsight-docker.env` - `/root/.hermes/CONFIG_OWNERSHIP.md` - `/root/.hermes/skills/hermes-agent/hindsight-ops/scripts/hindsight_ops.py` - `/root/hindsight-data` - `/root/.hermes/skills/hermes-agent-configuration/references/hindsight-bank-config-api.md` - `/root/.hermes/skills/hermes-agent-configuration/references/hindsight-bank-configuration.md` - `/root/.hermes/skills/hermes-agent-configuration/references/hindsight-performance-tuning.md` - `/root/.hermes/skills/hermes-agent-configuration/references/hindsight-pipeline-ops.md` - `/root/.hermes/skills/hermes-agent/hindsight-ops` - `/root/.hermes` - `/root/.hermes/auth.json` - `/root/weixin_file_archive` - `/root/.hermes/cache/documents` - `/root/weixin_file_archive/index.jsonl` - `/root/.hermes/memories/MEMORY.md` - `/root/.hermes/memories/USER.md` - `/root/.hermes/SOUL.md` - `/root/.hindsight/profiles/hermes.env` - `/root/.hermes/scripts/set-hermes-secret.sh` - `/root/.hermes/scripts/hermes_config_doctor.sh` - `/root/hindsight-docker.env.` - `/root/.local/bin/hermes` - `/root/.hermes/logs/gateway.log` - `/root/.hermes/logs/agent.log` - `/root/.config/systemd/user/hermes-gateway.service` - `/root/.local/bin/uv` - `/root/.cache/uv/archive-v0/LPWA6EWrRIreH1NY/bin/python` - `/root/.cache/uv/archive-v0/LPWA6EWrRIreH1NY/bin/amap-mcp-server` - `/root/.cache/uv/archive-v0/EatXorTLuHpK-0iT/bin/python` - `/root/.cache/uv/archive-v0/EatXorTLuHpK-0iT/bin/xhs-mcp` - `/root/.hermes/config.yaml.bak.20260606_071437` - `/root/.hermes/health_check_report.txt` - `/root/backups/hindsight/2026-06-23.sql.gz` - `/root/backups/hindsight/` - `/root/.hermes/cron/jobs.json` - `/root/.hermes/terminal_audit.log-45-` - `/root/.hermes/terminal_audit.log-46-` - `/root/.hermes/terminal_audit.log` - `/root/.hermes/terminal_audit.log-48-` - `/root/.hermes/terminal_audit.log-49-` - `/root/.hermes/terminal_audit.log-51-` - `/root/.hermes/terminal_audit.log-52-` - `/root/.hermes/state.db` - `/root/.hermes/terminal_audit.log-65-` - `/root/.hermes/terminal_audit.log-66-` - `/root/.hermes/terminal_audit.log-68-` - `/root/.hermes/terminal_audit.log-69-` ## 下一步协作建议 - 你可以在网页端补一句“继续/改方向/回滚到某步”,我会从这个 workspace 接续,不需要你回翻微信。 - 如果这个话题已经收口,可以在网页端把状态改成归档;当前 MVP 暂未加归档按钮,我会后续补。
保存
raw