机器学习模型生成胎儿健康三维图像-编程实验室

机器学习工具为医生提供胎儿健康更详细的三维图像

麻省理工学院计算机科学与人工智能实验室的研究人员开发了一种工具，可以对胎儿的形状和运动进行三维建模，有望帮助医生发现异常并做出诊断。

对于孕妇来说，超声波检查是一种能提供信息（有时是必要）的检查程序。它们通常会产生胎儿的二维黑白扫描图像，可以揭示关键信息，包括生物性别、大致尺寸以及心脏问题或唇裂等异常情况。如果医生希望进行更仔细的观察，可能会使用磁共振成像，该技术利用磁场捕获图像，可以组合起来创建胎儿的三维视图。然而，MRI并非万能；三维扫描结果难以让医生充分解读以诊断问题，因为我们的视觉系统不习惯处理三维容积扫描（换句话说，是一种能同时显示被扫描对象内部结构的全方位视图）。机器学习由此介入，它可以帮助根据数据更清晰、更准确地模拟胎儿的发育——尽管目前还没有算法能够模拟他们有些随机的运动和各种身体形态。

直到麻省理工学院计算机科学与人工智能实验室、波士顿儿童医院和哈佛医学院提出了一种名为“胎儿SMPL”的新方法，为临床医生提供了胎儿健康状况的更详细图像。该方法改编自计算机图形学中开发的用于捕捉成人体形和姿势的三维模型“SMPL”，作为一种准确表示胎儿体形和姿势的方法。随后，“胎儿SMPL”在20,000个MRI容积数据上进行训练，以预测胎儿的位置和大小，并创建雕塑般的三维表示。每个模型内部都有一个包含23个铰接关节的骨骼系统，称为“运动树”，系统利用它来摆出姿势并像训练期间看到的胎儿一样运动。

“胎儿SMPL”从大量真实世界的扫描中学到的知识使其具备了极高的精确度。想象一下，蒙着眼睛踏入一个陌生人的脚印，不仅完全合脚，还能正确猜出他们穿的是什么鞋——类似地，该工具能够紧密匹配其在之前未见过的MRI帧中胎儿的位置和大小。“胎儿SMPL”的平均错位仅约3.1毫米，这个间隙比一粒米还小。

这种方法可以使医生精确测量诸如婴儿头部或腹部的大小等指标，并将这些指标与同年龄的健康胎儿进行比较。“胎儿SMPL”已在早期测试中展示了其临床潜力，在一小组真实世界扫描中实现了准确的配准结果。

“估计胎儿的形状和姿势可能具有挑战性，因为他们被挤压在子宫的狭窄空间内，”论文主要作者、麻省理工学院博士生兼CSAIL研究员刘英成表示。“我们的方法通过使用三维模型表面下相互连接的骨骼系统来克服这一挑战，该系统能真实地表示胎儿身体及其运动。然后，它依靠坐标下降算法进行预测，本质上是交替地从复杂数据中猜测姿势和形状，直到找到可靠的估计。”

在子宫内

研究人员将“胎儿SMPL”在形状和姿势准确性方面与能找到的最接近的基线进行了测试：一个名为“SMIL”的模拟婴儿生长的系统。由于离开子宫的婴儿比胎儿大，研究团队将这些模型缩小了75%以创造公平的竞争环境。

该系统在波士顿儿童医院采集的胎龄在24至37周之间的胎儿MRI数据集上表现优于该基线。“胎儿SMPL”能够更精确地重建真实扫描，其模型与真实MRI紧密吻合。

该方法在将模型与图像对齐方面效率很高，仅需三次迭代即可达到合理的对齐效果。在一个计算“胎儿SMPL”在得出最终估计之前做出错误猜测次数的实验中，其准确性从第四步开始趋于稳定。

研究人员刚刚开始在现实世界中测试他们的系统，在初步临床测试中产生了类似精确的模型。虽然这些结果很有希望，但团队指出，他们需要将结果应用于更大的人群、不同的胎龄和各种疾病病例，以更好地了解系统的能力。

仅及皮肤深度

刘英成还指出，他们的系统仅有助于分析医生在胎儿表面能看到的情况，因为模型皮肤下只有类似骨骼的结构。为了更好地监测婴儿的内部健康状况，例如肝脏、肺和肌肉的发育，团队打算使其工具立体化，根据扫描结果对胎儿的内部解剖结构进行建模。此类升级将使模型更具人性化，但当前版本的“胎儿SMPL”已经为三维胎儿健康分析提供了一个精确（且独特）的升级。

“这项研究引入了一种专门为胎儿MRI设计的方法，能有效捕捉胎儿运动，从而增强对胎儿发育和健康的评估，”哈佛医学院儿科学副教授、波士顿儿童医院胎儿-新生儿神经影像与发育科学中心科学家今纪浩表示。未参与该论文的今纪浩补充说，这种方法“不仅将提高胎儿MRI的诊断效用，还将为胎儿大脑早期功能发育与身体运动的关系提供见解。”

“这项工作通过将参数化表面人体模型扩展到人类生命的最早形态——胎儿，达到了一个开创性的里程碑，”未参与此研究的格勒诺布尔阿尔卑斯大学副教授塞尔吉·普哈德斯表示。“它使我们能够分解人类的形状和运动，这已被证明是理解成人体形如何与代谢状况相关以及婴儿运动如何与神经发育障碍相关的关键。此外，胎儿模型源自并与成人（SMPL）和婴儿（SMIL）人体模型兼容这一事实，将使我们能够研究人类形状和姿势在长时间内的演变。这是一个前所未有的机会，可以进一步量化人类形状生长和运动如何受不同条件影响。”

刘英成与三位CSAIL成员共同撰写了这篇论文：王佩琪；麻省理工学院博士生塞巴斯蒂安·迪亚斯；以及资深作者波琳娜·戈兰德——麻省理工学院电气工程与计算机科学系的孙林和普里西拉·周教授、CSAIL首席研究员以及医学视觉小组负责人。波士顿儿童医院儿科学助理教授埃斯拉·阿巴西·特克、法国国家信息与自动化研究所研究员本杰明·比约以及哈佛医学院儿科学教授兼放射学教授帕特里夏·艾伦·格兰特也是该论文的作者。这项工作得到了美国国立卫生研究院和麻省理工学院CSAIL-Wistron项目的部分支持。

研究人员将在九月的国际医学图像计算与计算机辅助干预会议上展示他们的工作。
更多精彩内容请关注我的个人公众号公众号（办公AI智能小助手）或者我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号（网络安全技术点滴分享）

机器学习模型生成胎儿健康三维图像

机器学习工具为医生提供胎儿健康更详细的三维图像

esp32cam视频传输核心要点：内存管理与缓冲区分配

如何利用腾讯混元OCR实现端到端拍照翻译？开发者必看

低代码平台扩展插件：为Dify添加HunyuanOCR节点实现视觉理解

Cline 远程 MCP 鉴权：踩坑与最佳实践

教育行业应用场景：HunyuanOCR自动批改手写作业可行性分析

海外代购商品中文标签制作：HunyuanOCR自动翻译原始说明