news 2026/6/1 21:28:01

机器学习模型生成胎儿健康三维图像

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
机器学习模型生成胎儿健康三维图像

机器学习工具为医生提供胎儿健康更详细的三维图像

麻省理工学院计算机科学与人工智能实验室的研究人员开发了一种工具,可以对胎儿的形状和运动进行三维建模,有望帮助医生发现异常并做出诊断。

对于孕妇来说,超声波检查是一种能提供信息(有时是必要)的检查程序。它们通常会产生胎儿的二维黑白扫描图像,可以揭示关键信息,包括生物性别、大致尺寸以及心脏问题或唇裂等异常情况。如果医生希望进行更仔细的观察,可能会使用磁共振成像,该技术利用磁场捕获图像,可以组合起来创建胎儿的三维视图。然而,MRI并非万能;三维扫描结果难以让医生充分解读以诊断问题,因为我们的视觉系统不习惯处理三维容积扫描(换句话说,是一种能同时显示被扫描对象内部结构的全方位视图)。机器学习由此介入,它可以帮助根据数据更清晰、更准确地模拟胎儿的发育——尽管目前还没有算法能够模拟他们有些随机的运动和各种身体形态。

直到麻省理工学院计算机科学与人工智能实验室、波士顿儿童医院和哈佛医学院提出了一种名为“胎儿SMPL”的新方法,为临床医生提供了胎儿健康状况的更详细图像。该方法改编自计算机图形学中开发的用于捕捉成人体形和姿势的三维模型“SMPL”,作为一种准确表示胎儿体形和姿势的方法。随后,“胎儿SMPL”在20,000个MRI容积数据上进行训练,以预测胎儿的位置和大小,并创建雕塑般的三维表示。每个模型内部都有一个包含23个铰接关节的骨骼系统,称为“运动树”,系统利用它来摆出姿势并像训练期间看到的胎儿一样运动。

“胎儿SMPL”从大量真实世界的扫描中学到的知识使其具备了极高的精确度。想象一下,蒙着眼睛踏入一个陌生人的脚印,不仅完全合脚,还能正确猜出他们穿的是什么鞋——类似地,该工具能够紧密匹配其在之前未见过的MRI帧中胎儿的位置和大小。“胎儿SMPL”的平均错位仅约3.1毫米,这个间隙比一粒米还小。

这种方法可以使医生精确测量诸如婴儿头部或腹部的大小等指标,并将这些指标与同年龄的健康胎儿进行比较。“胎儿SMPL”已在早期测试中展示了其临床潜力,在一小组真实世界扫描中实现了准确的配准结果。

“估计胎儿的形状和姿势可能具有挑战性,因为他们被挤压在子宫的狭窄空间内,”论文主要作者、麻省理工学院博士生兼CSAIL研究员刘英成表示。“我们的方法通过使用三维模型表面下相互连接的骨骼系统来克服这一挑战,该系统能真实地表示胎儿身体及其运动。然后,它依靠坐标下降算法进行预测,本质上是交替地从复杂数据中猜测姿势和形状,直到找到可靠的估计。”

在子宫内

研究人员将“胎儿SMPL”在形状和姿势准确性方面与能找到的最接近的基线进行了测试:一个名为“SMIL”的模拟婴儿生长的系统。由于离开子宫的婴儿比胎儿大,研究团队将这些模型缩小了75%以创造公平的竞争环境。

该系统在波士顿儿童医院采集的胎龄在24至37周之间的胎儿MRI数据集上表现优于该基线。“胎儿SMPL”能够更精确地重建真实扫描,其模型与真实MRI紧密吻合。

该方法在将模型与图像对齐方面效率很高,仅需三次迭代即可达到合理的对齐效果。在一个计算“胎儿SMPL”在得出最终估计之前做出错误猜测次数的实验中,其准确性从第四步开始趋于稳定。

研究人员刚刚开始在现实世界中测试他们的系统,在初步临床测试中产生了类似精确的模型。虽然这些结果很有希望,但团队指出,他们需要将结果应用于更大的人群、不同的胎龄和各种疾病病例,以更好地了解系统的能力。

仅及皮肤深度

刘英成还指出,他们的系统仅有助于分析医生在胎儿表面能看到的情况,因为模型皮肤下只有类似骨骼的结构。为了更好地监测婴儿的内部健康状况,例如肝脏、肺和肌肉的发育,团队打算使其工具立体化,根据扫描结果对胎儿的内部解剖结构进行建模。此类升级将使模型更具人性化,但当前版本的“胎儿SMPL”已经为三维胎儿健康分析提供了一个精确(且独特)的升级。

“这项研究引入了一种专门为胎儿MRI设计的方法,能有效捕捉胎儿运动,从而增强对胎儿发育和健康的评估,”哈佛医学院儿科学副教授、波士顿儿童医院胎儿-新生儿神经影像与发育科学中心科学家今纪浩表示。未参与该论文的今纪浩补充说,这种方法“不仅将提高胎儿MRI的诊断效用,还将为胎儿大脑早期功能发育与身体运动的关系提供见解。”

“这项工作通过将参数化表面人体模型扩展到人类生命的最早形态——胎儿,达到了一个开创性的里程碑,”未参与此研究的格勒诺布尔阿尔卑斯大学副教授塞尔吉·普哈德斯表示。“它使我们能够分解人类的形状和运动,这已被证明是理解成人体形如何与代谢状况相关以及婴儿运动如何与神经发育障碍相关的关键。此外,胎儿模型源自并与成人(SMPL)和婴儿(SMIL)人体模型兼容这一事实,将使我们能够研究人类形状和姿势在长时间内的演变。这是一个前所未有的机会,可以进一步量化人类形状生长和运动如何受不同条件影响。”

刘英成与三位CSAIL成员共同撰写了这篇论文:王佩琪;麻省理工学院博士生塞巴斯蒂安·迪亚斯;以及资深作者波琳娜·戈兰德——麻省理工学院电气工程与计算机科学系的孙林和普里西拉·周教授、CSAIL首席研究员以及医学视觉小组负责人。波士顿儿童医院儿科学助理教授埃斯拉·阿巴西·特克、法国国家信息与自动化研究所研究员本杰明·比约以及哈佛医学院儿科学教授兼放射学教授帕特里夏·艾伦·格兰特也是该论文的作者。这项工作得到了美国国立卫生研究院和麻省理工学院CSAIL-Wistron项目的部分支持。

研究人员将在九月的国际医学图像计算与计算机辅助干预会议上展示他们的工作。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/31 2:09:45

esp32cam视频传输核心要点:内存管理与缓冲区分配

ESP32-CAM 视频传输实战:如何驯服内存与缓冲区的“野兽”你有没有遇到过这样的场景?明明代码逻辑没问题,摄像头也正常工作,可视频流就是卡顿、掉帧,甚至设备隔几分钟就自动重启。调试日志里满屏都是Guru Meditation Er…

作者头像 李华
网站建设 2026/5/7 21:00:15

如何利用腾讯混元OCR实现端到端拍照翻译?开发者必看

如何利用腾讯混元OCR实现端到端拍照翻译?开发者必看 在跨境电商客服每天要处理上百份来自不同国家的发票和产品说明书,旅游App用户对着外国菜单拍照却等了五六秒才出翻译结果——这些看似寻常的场景背后,暴露出传统OCR系统的深层痛点&#xf…

作者头像 李华
网站建设 2026/5/30 14:31:51

低代码平台扩展插件:为Dify添加HunyuanOCR节点实现视觉理解

低代码平台扩展插件:为Dify添加HunyuanOCR节点实现视觉理解 在企业数字化转型加速的今天,越来越多的应用场景要求系统不仅能“看懂”文字,还要能理解图像中的信息。比如财务人员上传一张发票照片,期望系统自动提取金额、日期和供应…

作者头像 李华
网站建设 2026/5/21 10:32:05

Cline 远程 MCP 鉴权:踩坑与最佳实践

最近在折腾 MCP Server,遇到个特别抓狂的问题。 本地开发一切顺利,GitHub Token 塞进 .env 环境变量里就完事了,Cline (VS Code 插件) 跑得飞起。但当我把 Server 部署到服务器上,想让团队里每个人用 自己的 GitHub Token 去跑任务…

作者头像 李华
网站建设 2026/5/30 6:44:06

教育行业应用场景:HunyuanOCR自动批改手写作业可行性分析

HunyuanOCR在教育场景中的应用:自动批改手写作业的可行性探索 在中小学日常教学中,教师平均每周要批改上百份作业——从数学题到语文作文,每一页都承载着学生的思考,却也消耗着老师大量本可用于个性化辅导的时间。尤其在低年级阶段…

作者头像 李华
网站建设 2026/5/23 7:07:50

海外代购商品中文标签制作:HunyuanOCR自动翻译原始说明

海外代购商品中文标签制作:HunyuanOCR自动翻译原始说明 在跨境电商和海淘日益普及的今天,越来越多消费者通过代购渠道购买海外护肤品、药品、婴幼儿用品等进口商品。然而一个普遍而棘手的问题随之而来:这些商品包装上的使用说明、成分表、注意…

作者头像 李华