news 2026/5/1 6:17:29

SSAS - 生成模拟测试数据

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
SSAS - 生成模拟测试数据

在分析系统中,因为数据量太大,无法直观看出统计结果的正确性。在使用新技术时,需要使用简单的数据,来验证语句的结果。本文介绍SQL Server生成模拟数据的方法。

使用技术

一、静态数据:VALUES

  1. 使用说明
  • 格式:VALUES (列1值, 列2值, 列3值), (列1值2, 列2值2, 列3值2)…
  • 命名:AS 表名(列1名, 列2名, 列3名),列的数量和顺序必须和 VALUES 里的一致
  • 类型:SQL Server 会自动推断列的数据类型(如数字、字符串、小数),也可手动指定(如 CAST(‘产品A’ AS VARCHAR(20)))。
  1. 示例
SELECT*FROM(VALUES(1,'张三','销售部',8000.00),(2,'李四','技术部',9500.50),(3,'王五','财务部',7800.80))ASEmployees(Id,Name,Department,Salary);
  1. 结果
IdNameDepartmentSalary
1张三销售部8000.00
2李四技术部9500.50
3王五财务部7800.80

二、序列数据:master.dbo.spt_values

  1. 使用说明
    利用 spt_values 生成时间序列:master.dbo.spt_values 中 type = ‘P’ 的记录包含连续的数字(0-2047),可以用它来生成 N 个月份的序列(对应 2024-2025 年)。

  2. 示例

SELECTnumberASId,DATEADD(MONTH,number,'2024-01-01')AS[Date]FROMmaster.dbo.spt_valuesWHEREtype='P'ANDnumberBETWEEN0AND23
  1. 结果
IdDate
02024-01-01 00:00:00.000
12024-02-01 00:00:00.000
22024-03-01 00:00:00.000
232025-12-01 00:00:00.000

三、随机数字:ABS(CHECKSUM(NEWID()))

  1. 使用说明
  • ABS(CHECKSUM(NEWID())):核心作用是生成一个随机的 32 位整数(非负数),常用来快速生成无规律的随机数,是 SQL Server 中生成随机整数的经典写法。
  • NEWID():创建一个全球唯一的UNIQUEIDENTIFIER类型值(GUID/UUID),格式如E2B5D86C-7B9F-4A8D-9876-1234567890AB。每次执行都会生成完全不同的值。
  • CHECKSUM():计算哈希值,对输入的任意值计算一个 32 位的整数校验和(哈希值),返回值是INT类型,范围为-21474836482147483647(可能是正数或负数)。
  • ABS():取绝对值
  1. 示例
SELECTABS(CHECKSUM(NEWID())),ABS(CHECKSUM(NEWID())),ABS(CHECKSUM(NEWID()))
  1. 结果
82013466315905810271359169063

实际应用

一、生成2025年目标数据

  1. 语句
SELECTDATEADD(MONTH,sv.number,'2025-01-01')ASDate,p.ProductId,ABS(CHECKSUM(NEWID()))%1000+100ASQuantity,(ABS(CHECKSUM(NEWID()))%1000+100)*10ASTotalFROMmaster.dbo.spt_values svCROSSJOIN(VALUES(101),(102),(103))ASp(ProductId)WHEREsv.type='P'ANDsv.numberBETWEEN0AND11ORDERBYDate,ProductId;
  1. 结果
DateProductIdQuantityTotal
2025-01-01 00:00:00.00010110114210
2025-01-01 00:00:00.0001024098650
2025-01-01 00:00:00.0001036849420
2025-02-01 00:00:00.0001012714340
2025-02-01 00:00:00.0001024116420
2025-02-01 00:00:00.0001032967140
2025-12-01 00:00:00.0001016424680
2025-12-01 00:00:00.00010210033790
2025-12-01 00:00:00.0001031596500
  1. 说明
  • 月份采用日期表示,以与实际完成数据维度对齐
  • 数量通常改为固定值,以方便在测试时判断统计是否正确
  • 用于SSAS命名查询,需去掉order by。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 17:20:51

买礼物(洛谷P1194)

题目描述又到了一年一度的明明生日了,明明想要买 B 样东西,巧的是,这 B 样东西价格都是 A 元。但是,商店老板说最近有促销活动,也就是:如果你买了第 I 样东西,再买第 J 样,那么就可以…

作者头像 李华
网站建设 2026/5/1 6:04:04

NFT:从加密猫到数字资产新纪元的全面解析

1 NFT:数字世界的所有权革命在数字化生存日益深入的今天,我们生产、消费和传播的数字内容比以往任何时候都多。然而,在传统的互联网架构下,这些数字资产极易被复制和传播,导致原创者难以确权和获利。NFT​ 的诞生正是为…

作者头像 李华
网站建设 2026/4/17 16:09:30

数据分类预测总让人头秃,传统BP神经网络容易掉进局部最优解的大坑。今天咱们搞点刺激的——用遗传算法给BP神经网络调参,直接在MATLAB里整活

基于遗传算法优化BP神经网络(GA-BP)的数据分类预测 matlab代码先看核心套路:遗传算法负责全局搜索找最优初始权值阈值,BP神经网络拿着这些参数做精细训练。这就像先用无人机扫描整座山找矿脉,再派专业挖矿队定点开挖。…

作者头像 李华
网站建设 2026/3/19 18:52:59

RTOS学习记录优先级翻转、信号量、互斥量

问题:优先级翻转是只会发生在信号量的使用中吗?答:虽然信号量是“重灾区”,但任何“独占式”且“不带优先级继承机制”的共享资源访问,都可能导致优先级翻转。包括:二值信号量 / 计数信号量(最常…

作者头像 李华
网站建设 2026/5/1 0:39:45

WeChatFerry微信机器人终极使用手册

WeChatFerry微信机器人终极使用手册 【免费下载链接】WeChatFerry 微信逆向,微信机器人,可接入 ChatGPT、ChatGLM、讯飞星火、Tigerbot等大模型。Hook WeChat. 项目地址: https://gitcode.com/GitHub_Trending/we/WeChatFerry 在智能化办公时代&a…

作者头像 李华