【OriginPro】3步搞定冲积图——从数据到美化

她笑中藏泪花
3小时前发布 /正在检测是否收录...

引言:挣脱“孤岛分析”的枷锁,让数据讲述完整故事

在处理问卷数据时,我们常常会遇到一些基础信息题,比如性别、年龄、学历等。常规的做法是什么?为性别画一张饼图,为年龄段画一张柱状图,再为学历分布画一张条形图。每一张图表都清晰、准确,但它们共同描绘的,却是一幅幅彼此孤立的“数据快照”。

这种分析方式,我们不妨称之为 “孤岛分析(island analysis)”。它能告诉你样本中有多少男性、多少女性,也能告诉你各个年龄段的人数分布,但它无法回答那些更深层次、更具价值的关联性问题。我们知道性别分布和年龄分布,但我们不清楚特定年龄段内的性别构成怎样;我们看到了高学历用户的比例,但他们究竟集中在哪些年龄段、性别是什么?是否存在某个特定群体,比如“18–25 岁的本科女性”,构成了我们用户画像的核心主力?这些答案就隐藏在各个数据孤岛之间的“海域”里。

要探索这片海域,我们需要一种新的导航工具。今天的主角——冲积图(Alluvial Diagram)——正是为此而生。它不仅仅是一种图表,更是一种 叙事可视化(narrative visualization) 工具。如果说传统图表是静态的快照,那么冲积图就是一部数据的“短片”。它能够直观展示数据在不同维度(如性别、年龄、学历)之间的 流动、分岔与汇合


第一章:名词厘清:冲积图到底是什么?和桑基图有什么不同?

1.1 定义与核心用途

一句话定义: 冲积图(Alluvial Diagram)是多维分类数据的流向图(flow diagram),用于可视化不同分类维度下群体构成的变化与流动。可以把它想象成“多列堆叠条”之间用丝带相连,把交叉频数表翻译成直觉的视觉语言。

在问卷场景中,冲积图可清晰揭示人口学特征之间的多对多映射,让我们一眼看出不同群体如何在各维度间重组,以及这些关联的强弱。

1.2 核心组件拆解

  • 步骤/轴(Steps/Axes):图中垂直排列的各维度列,如“性别 / 年龄 / 学历”。
  • 节点(Nodes):每个维度里的矩形色块,代表具体类别;高度与样本数(或权重)成正比
  • 流/连接线(Flows/Links):连接相邻维度节点的带状“丝带”;宽度代表同时具备两端属性的样本数量

类比理解:把每个维度想成一道“闸门”,每个类别是闸门口的“槽位”,而“流”就是通过相邻闸门的水流——流越宽,说明穿过两道筛选的成员越多

1.3 编者注:冲积图 (Alluvial) vs. 桑基图 (Sankey)

在可视化实践里,两者经常被混用。实操区分看两点核心目的布局约束

  • 桑基图(Sankey Diagram):其核心是追踪 “数量”(如能量、资金、用户流量)在某个系统或流程中的传递与转化。它的节点可以根据流程走向自由布局,甚至可以包含回路(Cycles)以表示反馈。
  • 冲积图(Alluvial Diagram):其核心是展示“成员”(如受访者、客户)在不同分类维度的归属与重组。它的布局受到严格约束,所有节点必须沿代表不同维度的垂直轴对齐,且流向通常是单向的(从左至右)。

第二章:为冲积图准备“完美”数据

2.1 数据格式的核心要求:原始数据 (Raw Data)

这里我们使用的的数据格式是原始数据(Raw Data),而不是计数数据(Count Data)

2.2 示例数据表

数据示例如下(每行代表一份问卷记录):

性别年龄学历
<18大专
18-25大学本科
26-30硕士研究生
≥31博士研究生

第三章:从零到一——在 OriginPro 中绘制冲积图

本章将以 OriginPro 2025b 为例,详细介绍绘制步骤

3.1 导入数据与准备工作区

启动 OriginPro,你会看到一个默认工程(含工作簿 Book)。将第二章表格数据(含表头)粘贴到 A、B、C 列。

3.2 生成基础图表

  1. 将每列设为“类别列(Set as Categorical)”并自定义顺序

    • 右键单击每个列的列标(如 A),选择 设置为:类别(Set as: Categorical)。此操作将告知 Origin 这些是分类数据。
    • 双击表头下方的 类别(Categories) 标签行,勾选自定义类别(可增删并设定任意顺序),按分析节奏设定显示顺序(如年龄从小到大)。
  2. 选择“冲积图”作图

    • 选中三列分类数据;
    • 菜单:绘图 → 关系图,流程图→ 冲积图

3.3 美化图片

打开 绘图细节(Plot Details) 对话框:双击图中任意节点/连线,或在右侧 对象管理器(Object Manager) 定位到当前图层。以下设置在 节点(Node)/ 连接线(Link)/ 标签(Label) 三处完成。
  1. 节点(Node)

    • 边框颜色(Border Color):可设为“无(None)”,让视觉聚焦填充色。
    • 填充颜色(Fill Color):点选“By Points”(按点)后有两种常用逻辑(见下节“节点配色里的两种逻辑”)。
    • 节点间隙(Gap Between Nodes, %):设为 1520,避免节点拥挤。
  2. 连接线(Link)

    • 使用源节点的颜色 (Use source node's color):流的颜色与其起点一致,强调来源。
    • 使用目标节点的颜色 (Use target node's color):流的颜色与其终点一致,强调去向。
    • 从起点到目标的渐变色 (Gradient from source to target):视觉效果最丰富,能清晰展示流动的过程。本文推荐此项
    • 使用颜色列表 (Use color list):为每一条完整路径(从第一轴到最后一轴)赋予独立颜色,适合路径数量较少时使用。
  3. 标签(Label)

    • 显示节点标签:勾选 名称和总数值 (Name and Total Value)
    • 总数值 (Total Value):可选择显示 计数 (Count)百分比 (Percentage),后者更利于直观比较。
    • 位置 (Position):选择 在节点的外部 (Outside of Node),并调整偏移量使其不与节点重叠。
    • 相同位置的名称值(V):选择名称在前总值单独摆放一行这样显示的较为美观。
  4. 尺寸与版面

    • 若图形占满显示范围:

      • 选项里将页面边距设为“页面”;
      • 在图表空白处右键 → 调整图层至页面大小...(Fit Page to Layer),再设置合适比例(如 85%)。

节点配色里的两种逻辑(By Points)

当你在 节点(Node) 页将 颜色(Color) 设为 “按点(By Points)” 时,OriginPro 提供了两种核心的颜色映射逻辑,它们决定了“每个类别具体获得哪种颜色”:

  • 索引(Indexing)

    • 含义:指定某一列(如 Col(A),即“性别”列)作为颜色索引键。拥有相同类别值的节点(如所有“男”节点,无论在哪一轴)将稳定地映射到颜色列表中的同一种颜色。这对于保证跨图表颜色一致性至关重要。
    • 适用:学术论文、系列报告中,需要确保“男/女”、“优/良/差”等核心分类在所有图表中颜色统一的场景。
  • 增量(Increment)

    • 含义不关心类别的值,而是严格按照节点在图中的出现顺序,从当前颜色列表中依次取色。顺序或筛选条件一变,整体配色可能随之改变
    • 适用:一次性探索性分析,或希望图中每个节点颜色都独一无二以作区分的场景。

选择建议

  • 追求一致性、可复现性 → 选 索引(Indexing)
  • 追求视觉多样性、顺序驱动 → 选 增量(Increment)

写在最后

冲积图的价值不在“好看”,而在把多维分类关系讲清楚,帮助发现“跨维度的关键群体”。

怎样美化图片、选择怎样的数据表达,因人而异。关键是让图表服务于“问题的答案”。冲积图将我们从单变量的“孤岛分析”中解放出来,带入关联、流动、多维的视角,把复杂的交叉列表翻译成可读的故事线,清晰呈现群体在不同属性下的结构与变迁。

现在,你已经掌握了这项可视化技术。是时候打开你的问卷数据,告别那些枯燥的数字和孤立的图表——让数据“流”起来,去讲述它背后的精彩故事。

© 版权声明
THE END
喜欢就支持一下吧
点赞 0 分享 收藏
评论 抢沙发
OωO
取消