news 2026/6/26 6:40:55

DiffBrush 模型:支持任意英文文本与 496 种 IAM 数据集手写风格;面向气候科学与 ESG 研究,全球气候与能源转型数据集发布

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
DiffBrush 模型:支持任意英文文本与 496 种 IAM 数据集手写风格;面向气候科学与 ESG 研究,全球气候与能源转型数据集发布

公共资源速递

This Weekly Snapshots !

4 个公共数据集:

* MAKIEVAL 多语言文化知识评估数据集

* Verbatim Spans 查询条件证据提取数据集

* AI Impact on Jobs and Layoff Risk AI 就业影响数据集

* Global Climate & Energy Transition 2000-2026 全球气候能源数据集

5 个公共教程:

* DiffBrush:手写文本行生成

* DVD:基于生成先验的确定性视频深度估计

* TADA-1b : 带文本-声学双重对齐的文本转语音系统

* NuExtract3:多模态文档理解与结构化信息抽取模型

* AutoFigure:基于 LLM 的学术论文插图自动生成系统

访问官网立即使用:openbayes.com

公共数据集

1. MAKIEVAL 多语言文化知识评估数据集

该数据集包含 7 个大语言模型在 13 种语言、19 个国家/地区、6 个文化领域下生成的文本及其自动抽取的文化实体与 Wikidata 对齐结果。

* 在线使用:

https://go.openbayes.com/IDtQQ

2.Verbatim Spans 查询条件证据提取数据集


该数据集包含 174,383 行训练数据与 20,174 行验证数据,覆盖自然语言处理论文、多领域问答以及代码与工具输出三大类型语料。

* 在线使用:

https://go.openbayes.com/Y8FSn

3.AI Impact on Jobs and Layoff Risk AI 就业影响数据集


该数据集包含 20,000 条合成员工记录,覆盖数据分析师、机器学习工程师、HR、学生等多个行业与职位类别,通过个人背景、职业属性、岗位特性以及人工智能使用程度四类变量来预测员工的裁员风险。

* 在线使用:

https://go.openbayes.com/1OrOC

4.Global Climate & Energy Transition 2000-2026 全球气候能源数据集

该数据集是面向气候变化、能源转型与碳减排研究的全球气候与能源转型数据集,旨在系统刻画全球气候变化与能源转型过程,可广泛应用于气候科学、ESG 研究、能源经济学、碳市场分析、政策评估以及机器学习预测等多个领域。

* 在线使用:

https://go.openbayes.com/jFAAe

公共教程

1. DiffBrush:手写文本行生成

DiffBrush 由华南理工大学和新加坡国立大学等机构于 2025 年发布。它利用扩散模型生成逼真的灰度手写文本行图像。该模型创新之处在于利用 Stable Diffusion VAE+UNet 架构,支持任意英文文本输入,包含来自 IAM 数据集的 496 种手写风格,输出 1024×64 的灰度图像。

* 在线运行:

https://go.openbayes.com/tl23D

项目示例

2.DVD:基于生成先验的确定性视频深度估计

DVD(Deterministic Video Depth Estimation)是由香港科技大学(广州) 团队于 2026 年 3 月提出的首个确定性视频深度估计框架,通过将预训练的视频扩散模型(Wan2.1)改造为单次前向传播的深度回归器,在保持生成模型强大语义先验的同时,彻底消除了随机性带来的几何幻觉问题。

* 在线运行:

https://go.openbayes.com/186ht

项目示例

3.TADA-1b : 带文本-声学双重对齐的文本转语音系统

TADA-1b 是由 HumeAI 团队于 2026 年 2 月发布的统一语音语言模型,面向语音合成、语音克隆、多语言配音等场景的音频生成任务。该模型基于 Llama 3.2-1B 底座构建,主打轻量化、高速稳定的音频生成能力,专门面向英文语音合成、零样本语音克隆、长文本旁白配音、语音续写等音频生成任务。

* 在线运行:

https://go.openbayes.com/9dhX4

项目示例

4.NuExtract3:多模态文档理解与结构化信息抽取模型

NuExtract3 由 NuMind 发布于 2026 年 6 月,是一个面向文档理解的 4B 参数多模态视觉语言模型。它将结构化信息抽取与文档图像转 Markdown 两类能力统一到同一个模型中,可用于扫描件、票据、表单、发票、合同和表格等文档的字段抽取、OCR 后处理、RAG 数据清洗和文档归档。

* 在线运行:

https://go.openbayes.com/M5vIx

项目示例

5.AutoFigure:基于 LLM 的学术论文插图自动生成系统

AutoFigure 是西湖大学 ResearAI 团队开发的智能学术插图生成系统。该系统利用大型语言模型通过迭代优化机制,从文本描述或研究论文中自动生成达到出版标准的高质量科学插图,支持 SVG 矢量图和 mxGraph XML(完全兼容 draw.io)两种输出格式。

* 在线运行:

https://go.openbayes.com/TqbNj

项目示例
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/26 6:37:04

随机抛物方程Schauder估计与经典解:从确定性正则性到随机分析

1. 项目概述:从确定性到随机性的经典理论跃迁 在偏微分方程的理论研究中,抛物方程占据着核心地位,它描述了热量扩散、粒子浓度演化等众多物理过程的时空变化规律。经典的确定性抛物方程理论,特别是关于解的“正则性”(…

作者头像 李华
网站建设 2026/6/26 6:36:34

关于ppt-master skill用法

1、下载ppt-master 下载方式:github下载zip文件 GitHub - hugohe3/ppt-masterhttps://github.com/hugohe3/ppt-master 2、下载好之后,解压,目录路径需要全英文 3、添加依赖,在ppt-master中右键打开cmd:pip install …

作者头像 李华
网站建设 2026/6/26 6:36:00

330kV线路距离保护设计:从原理到整定与调试的工程实践

1. 项目概述:从“跳闸”到“选择性切除”的跨越在电力系统里,高压输电线路是能源的主动脉,而继电保护则是守护这条主动脉的“免疫系统”。当线路发生故障时,保护装置必须在几十毫秒内精准判断,并下达跳闸指令&#xff…

作者头像 李华
网站建设 2026/6/26 6:35:06

Codex 历史会话删除工具

本工具适用于 Windows、Linux / Ubuntu 项目地址:leungWHu/codex-history-manager 最近在 Windows 上使用 Codex 时,我遇到一个挺容易被忽略的问题:通过 Desktop、VS Code、cmd 等不同入口开启过 Codex 对话后,如果当时只是关闭窗…

作者头像 李华
网站建设 2026/6/26 6:32:12

AS8133 DP转HDMI 4K60国产性价比

随着4K超高清显示全面普及,国产视频转换芯片快速崛起,AS8133国产芯片实现DP转HDMI4K60Hz单芯片方案,AS8133是面向DP转HDMI2.0的高集成国产转换芯片,原生支持4K60Hz、RGB4:4:4全色域输出,单芯片完成协议转换、电平适配、…

作者头像 李华
网站建设 2026/6/26 6:30:29

Line IoU Loss 完整实现原理

Line IoU Loss 是 CLRNet 专为行采样式车道检测设计的回归损失,核心思想:把每一行采样点左右扩展成一条水平短线段,逐行计算预测线段与真值线段的交并比,全局求和得到整条车道的 IoU,损失 1 - LIoU。一、前置&#xf…

作者头像 李华