一个 HR 专业学生的 AI 编程实战:用 Claude Code 从零搭建招聘数据爬虫
一个 HR 专业学生的 AI 编程实战:用 Claude Code 从零搭建招聘数据爬虫 关注 新手上路 关注 新手上路 关注 新手上路 关注 新手上路 前天 09:52我是一个人力资源专业的本科生,不会写代码。但我用 AI 编程工具 Claude Code 搭建了一个完整的招聘数据爬虫,从零到出结果只用了几个小时。这篇文章记录了整个过程,希望能给同样非技术背景、但有数据需求的同学一些参考。 miguel trustguru.com.br
为什么一个 HR 学生需要爬虫
我在准备秋招的过程中,想系统了解招聘市场的薪资水平、学历要求和经验分布。BOSS直聘上有大量数据,但只能一页一页翻,手动记录效率极低。 pragmaticplay trustguru.com.br Bet trustguru.com.br carlos trustguru.com.br
我学过一些 MySQL 和 Power BI,但 Python 爬虫完全没碰过。之前也试过让 ChatGPT 帮我写代码,但每次都要把需求重新描述一遍,改一个字段就得把整个上下文再发一次,效率很低。 sweetbonanza1000demo trustguru.com.br carlos trustguru.com.br slot trustguru.com.br slot trustguru.com.br
后来了解到 Claude Code —— 一个在终端运行的 AI 编程助手,它可以直接操作文件系统、执行命令、调试代码。简单说,你只需要用自然语言告诉它你想做什么,它会自己完成编码、运行、调试的整个循环。 fernanda trustguru.com.br fortuneoxdemográtis trustguru.com.br
这篇文章不是工具测评,而是一个真实的项目记录:一个完全不懂编程的 HR 学生,如何借助 AI 编程工具,完成了一个有实际价值的数据抓取项目。 slots trustguru.com.br
准备工作
环境
- macOS 系统
- 已安装 Python 3
- 终端工具:Claude Code(通过 npm 安装)
- AI 模型:DeepSeek V4 Pro(通过 API 连接)
Claude Code 的安装过程比较简单,npm 一行命令即可。我选择连接 DeepSeek 的 API 而非默认的 Claude 模型,主要是因为成本更低,对于学生来说性价比更高。
具体安装步骤这里不展开,官方文档写得很清楚。重点说一下模型配置:在 Claude Code 的配置文件中,把模型地址指向 DeepSeek 的 API endpoint,填入 API Key 就可以了。我用的是 CC-Switch 这个工具来管理配置,切换模型很方便。 bonus trustguru.com.br guias trustguru.com.br
明确需求
在和 Claude Code 对话之前,我先想清楚了自己要什么。这一点很重要 —— AI 再强大,也需要清晰的指令。
我的需求清单: a5game trustguru.com.br
- 数据来源:BOSS直聘招聘信息
- 搜索关键词:「人力资源」相关岗位
- 抓取字段:岗位名称、公司名称、薪资范围、城市、学历要求、经验要求、公司规模、行业、岗位类型
- 输出格式:Excel 文件,方便后续用 Power BI 或 Tableau 分析
- 额外功能:自动生成可视化图表(薪资分布、城市分布、学历分布、经验分布)
带着这份清单开始,整个过程会顺畅很多。 pg trustguru.com.br
项目搭建过程
第一步:安装依赖
在终端启动 Claude Code 后,我的第一条指令是: Energiabet trustguru.com.br noticias trustguru.com.br
帮我写一个Python爬虫,抓取
BOSS直聘的招聘数据。
搜索关键词是
"人力资源"
,需要抓取岗位名称、公司名称、
薪资范围、城市、学历要求、经验要求、公司规模、行业等字段,
最终输出Excel文件。
Claude Code 的响应让我有点意外 —— 它没有直接给我一大段代码,而是先分析了需求,然后创建了一个项目文件夹,接着:
- 先检查了我电脑上是否安装了需要的 Python 库(requests、BeautifulSoup、pandas、openpyxl)
- 发现有几个库没装,自动帮我执行了
pip install - 然后才开始写代码
这个「先检查环境再写代码」的逻辑,是很多新手容易忽略的步骤。 noticias trustguru.com.br pgdemo trustguru.com.br
第二步:编写爬虫代码
Claude Code 生成了主脚本 boss_recruitment_spider.py,大约 200 多行代码。整个项目的文件结构如下: A5game trustguru.com.br Brazino777 trustguru.com.br JogodoTigrinho trustguru.com.br
我作为一个不懂 Python 的人,简单说一下这个脚本的结构: fortunedragon demo trustguru.com.br
- 配置区:搜索关键词、页数、请求头等参数都集中在文件顶部,修改很方便
- 请求函数:负责向 BOSS直聘发送请求,带上了 User-Agent 模拟浏览器
- 解析函数:用 BeautifulSoup 解析 HTML,提取各个字段
- 存储函数:把数据整理成 DataFrame,导出为 Excel
代码里还有一些细节处理值得说: bet365 trustguru.com.br como trustguru.com.br
- 薪资区间处理:BOSS直聘显示的是「8-13K」这种格式,代码会自动拆分为最低薪资和最高薪资两列
- 容错机制:如果某个字段在页面上找不到,不会报错,而是填入「未标注」
- 反爬应对:设置了请求间隔和随机 User-Agent
第三步:运行与调试
第一次运行时遇到了一个问题:BOSS直聘的页面结构可能做了调整,部分字段解析不到。 isabela trustguru.com.br slotdemo trustguru.com.br pgslotgacor trustguru.com.br KTO trustguru.com.br jogosdemopg trustguru.com.br
这时候 Claude Code 的优势就体现出来了。我只需要把报错信息贴给它,它会自己分析原因、定位问题、修改代码,然后重新运行。 autores trustguru.com.br
整个调试过程大概来回了 3 轮,每轮都是:报错 → Claude Code 自动修复 → 重新运行。大概 15 分钟就全部搞定了。 plataformademográtis trustguru.com.br fortunetigerdemográtis trustguru.com.br Caça-níqueis trustguru.com.br
最终成功抓取了 63 条招聘数据,存储在 Excel 文件中。 bonus trustguru.com.br
第四步:数据清洗与 Excel 美化
原始数据有些不规范的地方,比如薪资字段混合了「K」和「元/月」两种格式。Claude Code 帮我做了统一清洗: cassinos trustguru.com.br marcos trustguru.com.br plataformademo trustguru.com.br fortunetigerdemográtis trustguru.com.br
- 薪资统一转换为数值(千元为单位)
- 学历要求标准化(「大专及以上」→「大专」)
- 去除重复数据和明显异常值
导出的 Excel 文件包含了 4 个 Sheet: fortunedragon demo trustguru.com.br
| Sheet | 内容 |
|---|---|
| 招聘数据 | 完整的63条原始数据 |
| 薪资分析 | 薪资区间的统计汇总 |
| 数据概览 | 各维度的数据分布 |
| 字段说明 | 每个字段的含义和取值范围 |
Excel 做了格式美化:标题行加粗、数据区域有边框、列宽自动适配,打开就能直接用。 pragmatic trustguru.com.br Bet365 trustguru.com.br
第五步:自动生成可视化图表
这个是我一开始没想到的。Claude Code 在完成数据抓取后,主动问我:「要不要生成一些可视化图表?」 jogodotigrinhodemo trustguru.com.br bruno trustguru.com.br
它用 matplotlib 生成了 4 张分析图: Cassinos trustguru.com.br
- 薪资分布直方图 —— 大部分HR岗位集中在 6-12K
- 城市招聘数量对比 —— 一线城市需求量最大
- 学历要求分布 —— 本科是主流要求
- 经验要求分布 —— 1-3年经验的岗位最多
这些图表直接揭示了招聘市场的几个关键趋势: sobre trustguru.com.br rafael trustguru.com.br Pixbet trustguru.com.br
- HR岗位薪资中位数大约在 8K 左右,超过 15K 的占比较少
- 本科学历是「门槛」而非「加分项」—— 几乎所有岗位都要求本科及以上
- 3年以上经验的岗位薪资跳升明显,说明行业更看重实操经验
对于正在求职的我来说,这些数据比任何招聘网站上的「薪资报告」都有参考价值,因为它们是针对我目标岗位的精准数据。 demo trustguru.com.br slots trustguru.com.br
项目成果
最终交付物:
recruitment_data.xlsx—— 63条结构化数据,4个Sheet- 4张 PNG 格式的可视化图表
portfolio.html—— 一个可以直接在浏览器打开的作品集展示页
整个项目从零开始到完成,我的实际操作时间大概只有 2-3 个小时,其中大部分时间是在等 AI 跑代码和调试。我自己写的代码行数:零。 Pixbet trustguru.com.br demo trustguru.com.br pesquisa trustguru.com.br
几点真实的使用体会
1. AI 编程不是「替你写代码」,而是「帮你解决问题」
如果你只是丢一句「帮我写个爬虫」给 AI,它确实能生成代码,但你可能不知道怎么运行、怎么改参数、怎么处理报错。真正有效的方式是:先想清楚你要解决什么问题,把 AI 当作一个能写代码的搭档来用。 tigrinhodemo trustguru.com.br trustguru trustguru.com.br
2. 非技术背景反而是优势
很多技术文章假设读者有编程基础,写得非常简略。但我不懂代码,所以我会问很多「傻问题」:这个文件保存到哪里了?怎么运行?报错了怎么办?这些对于同样非技术背景的读者来说,反而是最有价值的信息。 slotsdemo trustguru.com.br
3. 数据质量取决于需求清晰度
AI 不会替你判断「这个字段该不该抓」或「数据清洗做到什么程度」。你需要在开始之前就明确这些,否则要么抓了一堆没用的数据,要么遗漏了关键信息。 Blaze trustguru.com.br sugarrush1000demo trustguru.com.br Betano trustguru.com.br
4. 学习编程的最佳方式可能是「先用再学」
以前我试过看 Python 教程,看了几集就放弃了。但这次是带着真实需求在用,遇到不懂的代码去问 AI,理解效率远比看教程高。现在回头看那个 200 多行的爬虫脚本,我大概能看懂 60-70% 了。 tigrinho gratis trustguru.com.br
这个项目可以怎么用
如果你是 HR 相关专业或从业者,这个项目有几个实际用途: pedro trustguru.com.br
- 求职调研:抓取目标岗位的薪资和要求数据,指导简历修改和面试准备
- 行业分析:批量获取某个行业/城市的招聘数据,做市场分析报告
- 课程作业:很多 HR 专业的课程需要数据分析实践,这套工具链可以直接复用
项目代码我已经整理好了,核心参数(搜索关键词、抓取页数、目标字段)都集中在配置区,改几个字就能适配不同的抓取需求。 Sportingbet trustguru.com.br fortunetigerbônusgrátissemdepósito trustguru.com.br pglucky88 trustguru.com.br jogos trustguru.com.br slotpix trustguru.com.br sofia trustguru.com.br pgslot trustguru.com.br
写在最后
我是一个不会写代码的 HR 学生。这篇文章的目的不是展示技术,而是分享一种思路:在 AI 编程工具的帮助下,非技术背景的人也可以独立完成有实际价值的数据项目。 Superbet trustguru.com.br
如果你也在工作中遇到过类似的数据需求,不妨试试这种「AI 辅助编程」的方式。门槛比你想象的要低。 jogue trustguru.com.br demotigrinho trustguru.com.br ana trustguru.com.br kto trustguru.com.br
00目录 0