news 2026/5/1 7:05:21

如何更好地作为数据科学家进行沟通

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
如何更好地作为数据科学家进行沟通

原文:towardsdatascience.com/how-to-better-communicate-as-a-data-scientist-6fc5428d3143

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/57303eba632bf29139041b123b635534.png

图片由作者提供

在我之前的文章中,我提出了“*沟通我们的工作与编写代码、构建模型和产品以完成任务一样重要。”*的观点。

不幸的是,在现实中,我观察到许多数据科学家(尤其是初级数据科学家)在工作的讲故事部分上挣扎。他们手头有所有数据,但不知何故,信息似乎并没有传达给观众,分析最终变成了一份摆放在书架上的漂亮报告,无人问津,毫无影响。那么到底出了什么问题?

这里有一些我在这些年里学到的技巧,这些技巧将帮助你们作为数据科学家提高沟通能力。

始终使用金字塔原则

许多数据科学家以线性方式沟通(如图表左侧所示)。这是可以理解的,因为这是我们体验事物的方式,也是我们在日常生活中讲故事的方式。但这种方式并不是传达重要信息的最有效方式,因为听众在这种沟通中很容易迷失或感到无聊。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/3dc6c01a096e88ba43fa46cf9d261575.png

图片由作者提供

在商业沟通中,金字塔原则是金标准——如图表右侧所示。简单来说,始终从最重要的信息开始——洞察力;然后深入到细节。

与报纸文章的标题相似,洞察力会吸引观众的注意力。它们是你最终想要传达的内容,因此你需要将它们放在最前面。如果观众对细节感兴趣,他们会继续阅读(倾听);如果不感兴趣,他们会得到最重要的信息。

清理格式和语法

这可能看起来像是吹毛求疵,但让我告诉你为什么它可能比你想象的更重要。

我们大多数人知道阿尔伯特·梅拉比安的“7-38-55”口头沟通法则,它强调只有 7%的沟通是关于实际内容的,其余的是语气(38%)和肢体语言、面部表情等(55%)。当涉及到书面沟通时,可能不会那么极端,但你可以确信,你工作的视觉呈现已经在无声中传达了工作的质量。

当人们打开一个文档,里面包含着不同字体的数字和段落,没有正确的缩进,满是拼写错误的下划线等,他们很可能会开始怀疑分析过程中投入的勤奋程度,以及由此延伸出的结论质量。

这也是对观众的不尊重;混乱的格式会给读者带来额外的心理负担,他们必须弄清楚这一切。

那么你该如何着手呢?

一般的规则是尽可能使数字易于消化,并去除所有无用的细节。

让我用一个例子来演示我的意思:假设你想要传达关于用户基础构成的洞察,按国家划分。

一些数据科学家可能会展示如下:

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/21b5029163457b4f19d9f87b982ba99c.png

图片由作者提供

你可以立即做的几件低努力的事情:

  • 将数字格式更改为分隔千位的格式(在 Excel / Google Sheets 中,更改为“数字”格式并删除小数点

  • 按降序排列,以便信息更容易消化

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/5e9e3ddbf409a31fd0b1540477933f1d.png

图片由作者提供

详细数字更难理解。根据受众,他们可能不需要那么详细的程度,因此你可以进一步简化,并用千为单位表示数字:

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/085ff9cbf4947e1f72000df6083b56ef.png

图片由作者提供

选择合适的图表来传达你的观点

你选择的图表类型可能会凸显或埋没你的洞察力;图表应该作为对观众的一种视觉辅助。能够判断哪种图表/表格可以更有效地传达洞察力是数据科学家应具备的关键能力。

在上面的例子中,你最终的目标可能是传达按国家划分的会员基础。饼图比原始数字表或柱状图提供更直观的视觉效果,并且更容易判断每个桶的相对大小。

看看下面的图表,即使没有任何叙述,我也可以直观地得出一些洞察,比如“我们会员基础的超过一半居住在美国”或“德国、英国和意大利的用户数量相似”。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/a7f5d6361c62d351d4f05d33bf60a95d.png

图片由作者提供

专注于重要的数字,而不是展示所有数字

沟通就是关于优先级。你不必包含所有数字,仅仅因为你拥有它们。你想要帮助读者集中注意力,而不是用无关信息分散他们的注意力。

以我们的例子继续,展示长尾数字真的有意义吗?很可能没有。注意,上面自动生成的饼图已经出于这个原因隐藏了一些国家——它们太小,无关紧要,所以没有必要将它们挤到图表上。

因此,更好地呈现数据的方法是要么将长尾分组(在脚注中描述分组包含的内容)要么完全去除(如果它是另一种类型的图表,如分布图,而长尾不提供任何价值)。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/00a2219e17ac35509a2a1fc4ce2277de.png

图片由作者提供

请记住,没有经过练习,用数据有效地讲故事的能力是不会自然产生的。但这是区分优秀数据科学家和一般数据科学家的关键技能之一。

最佳的练习方式是通过实践。当有机会进行展示时,抓住机会,与队友或经理进行模拟演练,并在展示前后获取反馈。

想要关于如何成为更优秀数据科学家的文章?以下是一些建议:

一个能让你成为更优秀数据科学家的思维转变

如何让自己作为数据科学家更具抗裁员能力

软技能是你在数据科学面试中脱颖而出的关键

我在数据科学职业生涯中希望避免的 5 个错误

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/25 23:40:31

水作业.2

用程序模拟一个活动的投票统计功能。首先输入参选人员个数,再输入每位参选人员名字(不超过20字节),再输入选票张数,再依次输入选票中所选的参选人名(选票中必须选参选中的其中一位)。在输入选票…

作者头像 李华
网站建设 2026/5/1 5:01:44

小批量硅胶复模,±0.1mm精度,比钢模具少40%,品质保障

小批量硅胶复模,0.1mm精度,比钢模具少40%,品质保障“小批量生产选硅胶复模还是钢模具?精度能不能达标?成本会不会超支?”最近后台收到不少制造业朋友的留言,核心诉求都围绕着小批量生产的模具选型难题。尤其是初创企业、产品研发团…

作者头像 李华
网站建设 2026/5/1 6:16:09

基于Spring Boot的旅游攻略平台的设计与实现毕业设计源码

博主介绍:✌ 专注于Java,python,✌关注✌私信我✌具体的问题,我会尽力帮助你。一、研究目的本研究旨在设计并实现一个基于Spring Boot框架的旅游攻略平台,以解决当前旅游信息获取与分享过程中存在的诸多问题。具体研究目的如下:提…

作者头像 李华
网站建设 2026/5/1 5:07:19

第七届传智杯 初赛 小红的四子棋 题解 简单bfs遍历

描述小红和小紫正在下一个名字叫"四子棋"的游戏。游戏的规则如下: 棋盘是一个nn行mm列的矩阵,两人轮流下子。如果有一方出现横、竖或者斜对角线方向有4个或4个以上的相同颜色的连珠,则获得游戏胜利。 小红拿到了棋盘的终局&#xf…

作者头像 李华
网站建设 2026/4/16 15:20:11

关键词解释:教师-学生网络(Teacher-Student Network)

一句话概括: 教师-学生网络是一种“让一个模型教另一个模型”的学习框架——教师提供稳定、高质量的指导信号,学生通过模仿来学得更好、更快、更鲁棒。它广泛用于模型压缩、自监督学习和半监督学习,是现代 AI 系统的核心技术之一。一、通俗理…

作者头像 李华