The Exact ML Project I’d Build to Get Hired in 2026
TL;DR · AI 摘要
构建一个个性化、创新、相关且可实际运行的机器学习项目,是获得2026年数据科学职位的关键。
核心要点
- 优秀的机器学习项目需具备个性化、创新性、相关性和实际运行性。
- 使用优化引擎解决NFL幻想足球问题的项目,展示了深度和独特性。
- 遵循框架可帮助构建能吸引招聘经理注意的项目。
结构提纲
按章节快速跳转。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- 构建能获得工作的机器学习项目
- 成功项目的四个要素
- 个性化
- 创新性
- 相关性
- 实际运行性
- 示例项目
- NFL幻想足球优化引擎
金句 / Highlights
值得收藏与分享的关键句。
优秀的机器学习项目需具备个性化、创新性、相关性和实际运行性。
使用优化引擎解决NFL幻想足球问题的项目,展示了深度和独特性。
遵循框架可帮助构建能吸引招聘经理注意的项目。
我在2026年会构建的精确机器学习项目,以获得工作机会 | Towards Data Science
机器学习
我在2026年会构建的精确机器学习项目,以获得工作机会
遵循这个框架构建一个能给招聘经理留下深刻印象的项目
2026年6月9日
8分钟阅读
分享
图片由作者提供。
我经常被问到:
“我应该构建什么项目?”
这个问题充满了良好的意图,但本质上是错误的。
我已经审查了超过100份申请和作品集,只有少数几次,某人的项目让我印象深刻到足以进入面试阶段。
因此,在这篇文章中,我将给你提供我开发并遵循的精确框架,以找到适合你的完美机器学习项目,从而获得工作机会。
让我们开始吧!
为什么大多数机器学习项目会失败
让我告诉你一个所有招聘经理在每一家我工作过的公司都会想到的事情。
当我们看到一个房价预测模型或一个泰坦尼克号生存分类器时,我们不会想到“扎实的基础”。我们会想到“下一个”。
我甚至不是在开玩笑。
这些项目已经被做了太多次,以至于它们不能告诉我任何关于这个人的情况。
它们只能告诉我,他们可以按照一个标准的教程进行操作并复制结果。
一个能让你获得工作的项目有四个关键要素:
- 它是个人化的——你真正关心它所预测的内容。
- 它是新颖的——我之前没有见过一百次。
- 它是相关的——它与你想要从事的工作类型相关。
- 它是实时的——人们可以实际看到它的运行。
如果这四个方面都做对了,你的项目会让招聘经理记住你,这来自我亲自招聘的经验。
问题是没有人能直接给你一个这样的项目。它必须来自你自己。
因此,我不会给你一个想法,而是给你一个框架来遵循,以开发这样一个项目。
我还把这一框架转化为一份7页的可下载PDF工作手册,你可以在下面的描述中查看,以找到能让你获得工作的正确项目。
项目构建框架:盗用我用来获得10万美元+报价的精确项目想法框架,今天加入8000+数据求职者。projects.egorhowell.com
示例项目
在深入探讨框架之前,让我给你一个我们招聘的候选人的项目示例。
在我之前的一家公司中,我们正在招聘一名初级数据科学家,负责优化和运筹学问题。
我们招聘的候选人之所以脱颖而出,只有一个主要原因:他们有一个高度相关且非常个人化的项目,与这个职位非常匹配。
他们对NFL幻想足球充满热情,并希望改进他们每周团队选择的方式。
因此,他们开发了自己的优化引擎,以更有效地在程序的约束条件下分配球员。
这不仅仅是引擎本身;他们阅读了关于优化策略的学术论文,并研究了其他人是如何解决相同问题的。
这个项目涵盖了我们之前提到的四个要点:
- 它是个人化的——这是一个他们感兴趣的问题。
- 它是新颖的——它是独特的,我们之前和之后都没有见过类似的东西。
- 它是相关的——它展示了他们对优化和运筹学的热情和兴趣,这正是我们正在招聘的。
- 它是实时的——它与他们申请的职位直接相关。
现在,我将详细说明你可以遵循的框架,以构建一个与这个完全相同的项目。
从你的兴趣出发
当人们寻找一个项目来构建时,他们通常会打开一个机器学习数据集列表,最有可能是在 Kaggle 上,然后试图找到一些有趣的内容。
这种做法是错误的。
应该从你自己和你的兴趣出发。
更具体地说,写下你在工作之外、在数据和机器学习之外真正关心的五件事。
专注于你的爱好、痴迷的事物和其他你愿意毫无困难地谈论一小时的话题。
当我这样做时,我的列表大致如下:
- 投资
- 曲棍球
- 健身房/健身
- 电影
- YouTube
为什么我们需要选择一个我们感兴趣的事物?
因为一个你关心并感兴趣的项目,是你会完成的项目。
我再怎么强调都不为过,做一个真正激励你的项目,比做一个你“认为”你应该做的项目要容易得多。
一旦你有了这五个兴趣,请为每个兴趣写出五个你真正想回答的问题。
例如,“本周哪些幻想足球球员被低估了?”是一个问题,而“足球统计数据”则不是。
不要过度思考,只需简单地写下你的想法。
你现在可能会有25个潜在的项目想法,这些想法很可能完全独特,或者至少是很少有人见过的。
筛选你最喜爱的项目
现在我们需要将这个列表缩小到我们最喜爱的项目。
第一步是去除那些明显不是机器学习问题的问题或想法。例如,“为什么我喜欢电影?”是一个很好的问题,但它不是一个机器学习项目。
在非常粗略的高层次上,机器学习可以被分解为五个关键领域:
- 预测一个数字 —— 回归。
- 预测一个类别 —— 分类。
- 时间序列预测 —— 时间序列。
- 推荐事物 —— 推荐系统。
- 将事物分组 —— 聚类。
浏览你的25个或更少的问题,找出符合这五个领域之一的问题,并去除不符合的那些。
这将使我们剩下大约10到15个可以用机器学习解决的可行想法。
现在你需要选择一个,选择的方法是根据以下标准对这些想法进行评分:
- 它有多个人化?
- 它有多新颖?
- 它对我要申请的职位有多相关?
- 获取数据有多困难?
- 构建它有多困难?
每个想法按5分制评分,将所有分数加起来,得分最高的那个就是你将要构建的项目。
验证项目
在你投入数周时间构建这个项目之前,我想让你进行三次快速检查。
第一 —— 你的数据到底来自哪里?请说出一个真实的数据来源 —— 一个 API、公开数据集或任何其他独特的来源。如果你无法说出一个,那么找到数据就是你的首要任务。
第二 —— 假设每天花一两个小时,你是否能在大约两个月内完成一个初步版本?如果项目规模大于这个,那就缩小它。一个你实际完成的小项目,总是比一个你放弃的大项目要好。
第三 —— 这个项目有多常见?没有什么是真正原创的,但如果这个项目是你之前多次见过的,那么可能需要重新考虑,选择你的第二个选项。
通过这三项检查,你就完成了。
太棒了!你已经拥有了一个属于你自己的项目,这个项目是招聘经理没有见过上百次的项目,而且你实际上可以完成它。
使项目上线
和大多数人一样,你可能会在 Jupyter Notebook 上进行这个项目的初步研究和原型开发。
然而,如今的公司希望员工能够部署他们的解决方案,以创造商业价值。
即使你的模型是自变压器以来最好的东西,如果它被困在笔记本中,那也是毫无用处的。
部署一个模型实际上并不像人们想象的那么复杂。我曾指导过几位客户,他们没有任何经验,使用以下技术栈和流程成功构建了他们的第一个端到端机器学习模型:
- 在 Jupyter Notebook 中构建原型解决方案。
- 将这个 Jupyter Notebook 拆分成遵循生产代码标准的独立 Python 文件,实现诸如类型提示、格式化器和文档字符串等功能。
- 将你的 Python 文件添加到一个 git 仓库中,并创建一个优秀的 README 来解释这个项目。
- 添加所有关键的软件工程工具和概念,包括单元测试、Poetry 依赖管理、Makefile 和 PyEnv。
- 创建一个 Streamlit 仪表板来展示你的结果,并将其部署在 Streamlit 社区云上。
- 设置你的仓库,使其每天通过 GitHub Actions 运行。
Bish. Bash. Bosh.
你已经使用行业标准工具成功地端到端部署了你的模型,这正是我在顶尖科技公司担任机器学习工程师多年来一直在使用的工具。
我理解,对于刚开始接触这个领域的人来说,这可能看起来完全令人不知所措,身边也没有人可以指导你,所以我创建了一个模板仓库,其中包含了所有必要的样板代码来帮助你设置这个项目。
GitHub – egorhowell/ML-Project-Starter 通过在 GitHub 上创建账户,为 egorhowell/ML-Project-Starter 的开发做出贡献。github.com
另外一件事!
如果你认真考虑获得数据或机器学习相关的工作,那么我开放了我的指导计划中的一些名额。
在这个专门设计的计划中,你将与我和我的团队一起工作 12 个月,帮助你不仅申请,而且真正获得你梦想中的数据/机器学习工作。
在这里申请并预约你的免费通话。
实现你的梦想数据工作 实现你的梦想数据科学工作,并通过高达 15 万美元的指导提高你的薪资。coaching.egorhowell.com
与我联系
- 网站
作者
查看 Egor Howell 的所有文章
职业建议
,
深度学习
求职
机器学习项目
分享这篇文章
- 在 Facebook 上分享
- 在 LinkedIn 上分享
- 在 X 上分享
Towards Data Science 是一个社区出版物。提交你的见解,以触及我们的全球受众,并通过 TDS 作者支付计划获得报酬。
更新 href 为你的实际提交 URL
为 TDS 写作
✦ 结束 CTA ✦