news 2026/6/12 8:27:27

如何使你的数据科学/机器学习工程师工作流程更有效

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
如何使你的数据科学/机器学习工程师工作流程更有效

原文:towardsdatascience.com/how-to-make-your-data-science-ml-engineer-workflow-more-effective-4f857c36bbc1

任何从事编程工作的人都需要一个有效的流程。许多任务都很耗时,你希望尽可能多地自动化以减少手动工作。在这篇文章中,我讨论了我最近如何作为一个数据科学家更新我的工作流程,从使用 Jupyter 笔记本转向使用 VS Code 交互式窗口。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/3d3af8e48c80d9b57c3b44f0844b688c.png

本文讨论了如何使用 VS Code 交互式窗口来优化你的数据科学/机器学习工程工作流程。图片由 ChatGPT 提供

为了展示新的工作流程,我将使用一些简单的代码来突出如何使用新的工作流程更快地工作。然而,你应该注意,我认为新工作流程的好处随着项目的复杂度增加而增加。当项目变得更大时,Jupyter 笔记本的问题就会增多,更难对你的数据进行概述。因此,我认为我在本文中展示的工作流程的好处将随着实际项目而增加。我将在整篇文章中使用图片和视频来直观地展示如何使用 VS Code 交互式窗口。我写这篇文章的灵感来自 Dave Ebbelaar 的这个 YouTube 视频(https://www.youtube.com/watch?v=qFvInA7DKuE&t=395s),关于他如何停止使用 Jupyter Notebook。

目录

· 动机 · 使用 VS Code 交互式窗口 ∘ 设置 ∘ 好处 · 结论

动机

我写这篇文章的动机是,作为一个数据科学家,我一直在寻找改进我工作方式的方法。我认为在我的工作中,保持对最新趋势的了解至关重要,无论是跟上最新的机器学习模型,使用新的 IDE 如 Cursor,还是通过使用交互式窗口来改进我的工作流程。因此,在这篇文章中,我分享了我在数据科学相关项目中最近的工作流程变化,从在 Jupyter 笔记本中工作到使用 VS Code 中的交互式窗口。改变工作流程后,我在编写代码和实验方面变得显著更有效率,这对于你想要在数据科学项目中取得成功至关重要。

使用 VS Code 交互式窗口

设置

要开始使用 VS Code 中的交互式窗口,你必须在设置中激活它。打开 VS Code 的设置,搜索 Jupyter 交互式窗口,并启用表示“按 shift+enter 时,发送所选代码”的复选框。下面是一个设置图片的示例:

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/950016c6becd04dad6caede266d25ab4.png

在 VS Code 中激活交互式窗口设置的图片。图片由作者提供。

现在,你已经准备好使用交互式窗口了。打开一个 Python 文件,标记你想要运行的代码,然后按住 shift 键并按下 enter 键。只有标记区域内的代码会被运行,并且变量会被存储。这允许你直接从 Python 文件中工作,同时获得使用 Jupyter Notebooks 的大部分好处。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/5b834cb2011850016a7092f5c6d938e6.png

此图片展示了我标记了左侧所有代码并按下 shift enter 后的 VS Code 视图。这打开了右侧的交互式窗口,运行了你所选的所有代码(你只看到第一行,但你也可以扩展该行,如图片下方所示。图片由作者提供。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/61e37828ddf1c1147f63ecf2f75e9113.png

展示如何扩展运行单元格以增强清晰度的图片。图片由作者提供。

现在,变量ab已经被定义,例如,为了理解加法函数的工作原理,我可以通过按行标记第 5 行,按下 shift enter,然后只标记单词 result 来打印出结果值。请注意,在这个例子中,函数非常容易理解,但随着你处理更复杂的编程,这会非常有用,便于轻松理解和调试函数。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/8cd45c315ec5354884c0b383151444e5.png

运行第 5 行,定义变量 result 后,标记变量 result,并运行它以查看变量的值。图片由作者提供。

你可以在这里使用的另一个有用功能是打开终端窗口(在 Windows 上使用 ctrl+j,在 Mac 上使用 cmd+j)。然后,你可以选择 Jupyter 标签来查看所有变量的值。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/39a07d08bd778b80a33a36e9329a3b52.png

在底部打开 Jupyter 终端后的我的 VS Code 视图,以查看所有变量的值。这有助于快速检查所有变量的值,便于轻松调试和理解代码。图片由作者提供。

您可以观看以下我解释的视频:

cdn.embedly.com/widgets/media.html?src=https%3A%2F%2Fwww.loom.com%2Fembed%2F1e5ec8dec00e40be9ccc6f4e130cf810&display_name=Loom&url=https%3A%2F%2Fwww.loom.com%2Fshare%2F1e5ec8dec00e40be9ccc6f4e130cf810%3Fsid%3Dace6f471-ca4a-42f7-8555-a05537cfb18a&image=https%3A%2F%2Fcdn.loom.com%2Fsessions%2Fthumbnails%2F1e5ec8dec00e40be9ccc6f4e130cf810-d3135cc5319d4086.gif&key=a19fcc184b9711e1b4764040d3dc5c07&type=text%2Fhtml&schema=loom

优点

使用交互式窗口有许多好处。以下列出了主要优点:

  • 更快。我认为使用交互式窗口比使用 Jupyter 笔记本工作更快。你不需要创建单元格;你可以简单地标记代码并运行它。例如,要打印变量,你只需要选择变量并按 shift enter 键,而不是创建一个新的单元格,编写变量名,然后运行单元格。

  • 更干净的代码。我认为在 .py 文件中编写代码通常迫使你编写更干净的代码,例如,通过尽可能多地使函数模块化。Py 文件通常也比 Jupyter 笔记本更容易阅读。

  • 生产就绪。在 Py 文件中编写代码意味着你的代码已经准备好推送到生产环境,这样可以节省更多时间。

结论

在这篇文章中,我讨论了您如何使用 VS Code 交互式窗口来提高作为数据科学家或机器学习工程师的工作流程效率。我发现从 Jupyter 笔记本切换到交互式窗口后,生产力显著提升,因此我认为这绝对是一个值得尝试的改变。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/11 9:50:00

XUnity.AutoTranslator:一键实现Unity游戏多语言翻译的革命性工具

XUnity.AutoTranslator:一键实现Unity游戏多语言翻译的革命性工具 【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator 在当今全球化的游戏市场中,语言障碍往往成为玩家体验的绊脚石。X…

作者头像 李华
网站建设 2026/6/10 15:23:58

PaddlePaddle镜像如何对接Kubernetes做集群管理?

PaddlePaddle镜像如何对接Kubernetes做集群管理? 在AI模型训练任务日益复杂、GPU资源成本高企的今天,企业不再满足于“单机跑得通”的开发模式,而是迫切需要一套可扩展、易运维、能支撑多团队协作的AI基础设施。传统的脚本化部署方式早已捉襟…

作者头像 李华
网站建设 2026/6/9 7:37:12

电商数据分析的未来技术趋势

电商数据分析的未来技术趋势 关键词:电商数据分析、未来技术趋势、人工智能、大数据、云计算、物联网、区块链 摘要:本文深入探讨了电商数据分析的未来技术趋势。在电商行业快速发展的背景下,数据分析变得至关重要。文章首先介绍了电商数据分析的背景,包括目的、预期读者、…

作者头像 李华
网站建设 2026/6/10 15:26:31

PassFab 4EasyPartition(系统迁移工具)

链接:https://pan.quark.cn/s/11c220f42535PassFab 4EasyPartition是一款专业的系统迁移和磁盘分区管理工具,旨在提供安全可靠的数据备份和磁盘管理解决方案。它支持Windows操作系统,并允许用户将系统、数据和应用程序迁移到其他硬盘或电脑上…

作者头像 李华
网站建设 2026/6/9 20:09:50

Java毕设项目推荐-基于springboot的茶食酒馆网站茶席布置、酒柜陈列季节限定茶酒茶食佐酒【附源码+文档,调试定制服务】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/6/6 1:57:12

Java毕设项目推荐-基于springboot的旅拍在线婚纱摄影网站的设计与实现目的地推荐、在线预约、风格展示、套餐预订、行程规划【附源码+文档,调试定制服务】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华