引言
云雨图(Raincloud Plot)是一种集成“数据分布形态”、“个体观测点”与“关键统计摘要”于一体的可视化方法。它由半边小提琴图旋转而成,由半边小提琴图(“云”)、抖动或分箱的原始数据点(“雨”)以及可选的箱线图或均值/中位数等摘要信息构成。该图旨在以更直观、模块化且统计稳健的方式,克服传统柱状图或均值-误差线图所带来的信息遮蔽与误导风险。这一路线由 Allen 等人系统阐释,其核心价值在于同时呈现原始数据与分布形状,从而减少观者的猜测空间并消除可视化冗余。
然而,云雨图并非万能。在数据点(尤其是重复测量)极其密集或分组过多时,点云与密度层可能拥挤,影响判读;而在仅需呈现简单计数或比例时,柱状图或堆叠条形图即可满足需求。
代码实现参考(Python/Matlab/R):RainCloudPlots 开源仓库(作者维护)。
数据要求
数据需为数值型数据。
列安排与标签
- 最少数据量:至少 1 列数值数据即可生成(更常见为多列并排比较)。
- 分组命名:列的长名称/注释等标签将用于坐标轴刻度与图例,可在绘图前于列标签行就地维护,后续自动继承到图中。
Origin Pro 绘图教程
云雨图本质上是旋转后的半小提琴图 + 个体数据点 +(可选)统计摘要。在 OriginPro 中,有两种思路可以实现。
操作提示(GUI 模式):Origin 2025b 新增“统计模式(Stats GUI Mode)”,可在 设置(Preferences)→ GUI 模式(GUI Mode) 与默认模式互相切换。本文以默认模式描述菜单路径;若找不到相应菜单,请先切回默认模式。
绘制基本图形
方法一:手动构建(半小提琴图 + 旋转)
- 选择数据:在工作表中选中所有需要绘制的 Y 数据列。
- 生成半小提琴图:通过菜单栏 绘图 (Plot) → 统计图 (Statistical) → 半小提琴图 (Half Violin) 创建图形。
- 交换坐标轴:单击右侧图形工具栏中的 交换 X–Y 坐标轴 (Exchange X-Y Axes) 按钮,或通过菜单 图形 (Graph) → 交换 X–Y 坐标轴 (Exchange X-Y Axes) 完成旋转,使图形横向展示。
方法二:直接使用云雨图绘图模板
- 菜单 工具(Tools)→ 模板中心(Template Center) 打开在线模板库,搜索 “Raincloud”/“云雨图” 并安装。模板中心会获取在线模板,并在“扩展模板”中提供使用入口。
- 回到数据表,勾选数据列 → 绘图 → 扩展模板 → 云雨图(Raincloud Plot)。
图形美化
生成基本图形后,通常需要进行精细化调整以达到出版要求。双击图中的任意元素(如数据点、坐标轴)即可打开 绘图细节 (Plot Details) 对话框。
调整“云”与“雨”
“云”(密度图):在左侧面板选中对应的数据图层,切换到 分布 (Distribution) 选项卡。
- 填充与颜色:在 填充 (Fill) 区域,按曲线(Fill to Curve) 配置一组较为美观的颜色。
- 尺寸与宽度: 尺寸 (Size) 建议勾选 宽度,以确保各组的最大宽度视觉上可比。通过调整 尺寸至最大(%) 控制整体占比。
“雨”(原始数据点)
- 样式:在 符号 (Symbol) 选项卡中,建议将 形状 (Shape) 设置为 圆形 (Circle),填充 (Fill) 设为 空心 (Open)。为保证清晰度,大小 (Z) 建议设为 3 pt 左右,边缘厚度 (T) 设为 0.5–1 pt。
- 分布:若数据点过于稀疏,可在 数据 选项卡勾选分格数,填写一个较大的值。
配置箱线图与统计摘要
- 箱体:切换到 箱体 (Box) 选项卡,在 样式 (Style) 中选择 普通箱体。箱体宽度 (%) (Box Width (%)) 可适当调整以匹配整体视觉。在 图案 (Pattern) 选项卡中可修改边框与填充色。
- 须线 (Whiskers):在 箱体 选项卡中的须线---范围 (Range) 字段定义了须线的计算方式,标准云雨图通常设为 最小值-最大值 (Min-Max)。须线样式更改在线条选项卡----须线,可更改该线条样式和颜色宽度。
- 百分位数:在 百分位数 (Percentile) 选项卡中,可以勾选并自定义 最大值 (Max)、最小值 (Min) 和 均值 (Mean) 等标记的样式,将最大/最小值标记设置为
|
,平均值设为〇
。
配置坐标轴与图层
- 打开设置:双击任一坐标轴,打开 坐标轴 (Axes) 设置对话框。
轴线与刻度
- 在左侧面板中,按住
Shift
键,依次点击 下 (Bottom)、左 (Left)、上 (Top) 和 右 (Right),将所有轴同时选中。 - 切换到 轴线和刻度线 (Line and Ticks) 选项卡,将 主刻度 (Major Ticks) 和 次刻度 (Minor Ticks) 的 样式 (Style) 均设置为 朝内 (In)。根据需要调整其长度与粗细。
- 在左侧面板中,按住
网格线
- 在左侧面板中单独选中 垂直 (Vertical) 轴。
- 切换到 网格 (Grids) 选项卡,勾选 显示 (Show) 主、次网格线,并可调整其样式(如虚线)与粗细,以增强可读性。
图层框架
- 关闭设置对话框后,单击图形,在弹出的浮动工具栏中,点击 图层框架 (Layer Frame) 按钮(第一行第二个),为图形添加一个完整边框。
解读云雨图:详解三大核心元素
为了更直观地理解云雨图的构成,我们将三个核心组成部分——“云”、“雨”、统计摘要——逐一解析,并给出判读要点。
1. “云”(Cloud):数据分布的概率密度
“云”是云雨图的标志性元素,本质是一个半边小提琴图(Half Violin)。曲线的宽度反映了该数值处观测的相对密度:越宽表示数据越集中,越窄表示数据越稀疏。这种“形 + 量”的结合,能揭示偏度、长尾与多峰等细节。
2. “雨”(Rain):原始数据的个体展示
“雨”由抖动或分箱后的原始数据点构成,保障了可视化的透明度。你能直接看到每个观测值的位置、离散程度以及可能的群集与离群。对于样本量很大时,建议适当降低点尺寸或加强分箱/抖动,以避免过绘制。
3. 统计摘要(Summary Statistics):关键指标的浓缩
云雨图可叠加 中位数/均值点、箱体 与 须线(常见为最小值–最大值) 等摘要信息,从而在展示全貌的同时,提供可复现的数值锚点。若不希望箱体遮挡密度层,可调整透明度或将箱体轻微偏移。具体组件与含义可参照 Origin 的“Violin with Quartile / Box”说明。
参考文献
Allen, M., Poggiali, D., Whitaker, K., Marshall, T. R., van Langen, J., & Kievit, R. A. (2021). Raincloud plots: a multi-platform tool for robust data visualization. _Wellcome Open Research_, _4_, 63. (Version 2, published 21 January 2021). https://doi.org/10.12688/wellcomeopenres.15191.2