博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
大数据可视化知识点
阅读量:5142 次
发布时间:2019-06-13

本文共 2346 字,大约阅读时间需要 7 分钟。

        第一章

         可视化定义:   利用人眼的感知能力对数据进行交互的可视表达以增强认知的技术,称为可视化。

  1. 数据可视化的主要作用包括数据记录和表达数据操作数据分析三个方面,这也是可视化技术支持计算机辅助数据认知的三个基本阶段。
  2. 可视化定义:   利用人眼的感知能力对数据进行交互的可视表达以增强认知的技术,称为可视化。
  3. 据Ward m o(2010)的研究,超过(50%)的人脑功能用于视觉信息处理,视觉信息处理是人脑的最主要功能之一。
  4. 从宏观角度看,数据可视化的功能不包括(C)

信息记录 信息的推理分析 信息清洗 信息传播

  1. 可视化的意义:
  • 真(真实性) 指是否正确地反映了数据的本质,以及对所反映的事物和规 律有无正确的感受和认识。
  • 善(倾向性) 是可视化所表达的意象对于社会和生活具有什么意义和影响。
  • 美(艺术完美型) 指其形式与内容是否和谐统一,是否有艺术个性,是否有创 新和发展。

        第二章

1. 数据:数据是符号的集合,是表达客观事物的未经加工的原始素材。

数据模型:用来描述数据表达的底层描述模型,包含数据的定义和类型,以及不同类型数据的操作功能

概念模型:对目标事物的状态和行为进行抽象的语义描述,并提供构建、推理支持等操作

2.数据分7类:一维 二维 三维 时间 多维 树 网络

3. 数据可视化流程:

问题刻画层:概括现实生活中用户遇到的问题

抽象层:抽象相应数据类型的操作

编码层:设计编码和交互方法

实现层:实现算法和交互

3数据可视化流程的核心要素:

• 数据表示与变换

• 数据的可视化呈现

• 用户交互

以分为三类:

原始数据绘图

  1. 折线图
  2. 柱状图
  3. 直方图
  4. 饼图
  5. 等值线图
  6. 走势图
  7. 散点图
  8. 维恩图
  9. 热力图

 简单统计值标绘

多视图协调关联

4.等值线是制图对象某一数量指标值相等的各点连成的平滑曲线,由地图上标出的表示制图数量的各点,采用内插法找出各整数点绘制而成的。

5.平行坐标系是一种多维数据可视化技术技术,使用平行的数值轴线来代表维度,通过在轴上刻画多维数据的数值并用折线相连某一数据项在所有轴上的坐标点,从而在二维空间内施展多维数据。

可视分析流程图的起点是数据表示与转换,终点是分析推理

极坐标图形是使用原点和相角来绘制的

数据可视化的三种类型:数据可视化 科学可视化 信息可视化  

        第三章

1.可视化是对数据的透彻理解、深入分析和综合运用,主要包括数据采集、数据处理、数据处理可视化模式和可视化应用4个环节

2.人眼的视觉有惰性,这种惰性现象也称为视觉暂留,视觉暂留时间约为0.05~0.2s

3.雷达图适用于多维数据,且每个维度必须可以排序。

 

        第四章

1.层次数据主要表现为两类:包含和从属 逻辑上的承接关系

2.层次数据化主要类别:节点-链接 空间填充  混合型

①节点-链接(node-link):将单个个体绘制成一个节点,节点之间的连线表示个体之间 的层次关系

优点:直观清晰,特别适合用于表示承接的层次关系

缺点:当个体数目太多,特别是广度和深度相差较大的时候,节点-链接伐的可读性较差,大量数据点聚集在屏幕局部范围,难以高效的利用有限的屏幕空间

②空间填充(space-filling):用空间中的分块区域表示数据中的个体,并用外层区域对内层区域的包围表示彼此之间的层次关系

优点:具有高效的屏幕空间利用率,可以呈现更多的数据,更适合于显示包含和从属的关系

缺点:数据的层次关系表达不如节点-链接法清晰

3.网络数据(network data):不具备层次结构的关系数据,可统称为网络数据

4. 文本可视化:采用可视表达技术,刻画文本和文档,直观地呈现文档中的 有效信息。用户通过感知和辨析可视图元提取信息

5.文本可视化的核心:如何辅助用户准确无误的从文本中提取并简洁直观地展示信息

6.文本信息的层级: • 词汇级 • 语法级 • 语义级

7.文本可视化流程:原始文本 文本信息挖掘 视图绘制 人机交互

8. 文本信息挖掘(包括三个方面):

文本数据的预处理

文本特征的抽取

文本特征的度量

9. 标签云(tag cloud,又名text cloud、word cloud)

直接抽取文本中的关键词并将其按照一定顺序、规律和约束整齐美观地排列在屏幕上标签云利用颜色和字体大小或他们的组合来表示重要性,越是重要的词汇,其字体越大,颜色越显著,反之亦然

  1. 文本内容可视化:基于关键词的文本内容可视化(标签云)、时 序性的文本内容可视化(主题河流)
  2. 情感分析:常被应用与论坛用户发言、社交网络、微博数据,以及各种调研报告等文本
  3. 文本特征: 分布模式可视化、文档信息检索可视化、软件可视化
  4. 基于任务分类学的数据类型定义了7个基本任务,分别是:总览 缩放 过滤 按需细化    关联 历史和提取
  5. 人流走势代码

 

 

        第五章

1.主动式交互(双向交互):能达到人与人的交互的体验

2.被动交互(单向交互):在用户与系统/产品进行交互的操作过程中,用户自身对于数 据建立的心智模型也在不断地变化并改进,这种交互称之为被动交互。

3.. 三种不同类别的交互操作的延时期望:

①感知处理(perceptual processing):指用户感知交互效果的过程

②立即反应(immediate response):指用户和可视化系统之间类似对话的交互,

③基本任务(unit task):指用户在交互中指令系统完成一个相对复杂的任务。

3.(重点)交互技术:选择 导航 重配 编码 抽象/具象 过滤 关联 概览+细节 焦点+上下文

4.可视化工具 Echarts Tableau

 

转载于:https://www.cnblogs.com/bjx817/p/10211152.html

你可能感兴趣的文章
lua中类的实现原理和实践
查看>>
阿里云对象存储OSS————跨域资源共享(CORS)(m3u8 无法加载m3u8:跨域访问被拒绝)...
查看>>
uva439 - Knight Moves(BFS求最短路)
查看>>
《这样装修最省钱》—— 读后总结
查看>>
如何在Elasticsearch中安装中文分词器(IK+pinyin)
查看>>
Docker安装(centos7.4)
查看>>
userdata
查看>>
威佐夫游戏 51Nod - 1072(威佐夫博弈入门经典题)
查看>>
Hibernate 简易入门教程
查看>>
sed入门详解教程
查看>>
MD5骨骼动画模型加载
查看>>
kubernetes 命令方式 部署、访问应用
查看>>
11:HTML5 发展史
查看>>
Redis批量导入数据的方法
查看>>
微信公众号、人脉拓展、运营
查看>>
Android中的selector的使用
查看>>
JAVA_OA管理系统(三)番外篇:Myeclipse导入Spring源码包
查看>>
面向对象的补充
查看>>
一个python特性的错误
查看>>
九度oj 题目1473:二进制数(stack)
查看>>