当前位置：主页 > 查看内容

架构之:数据流架构

发布时间：2021-06-18 00:00| 有位朋友查看

简介：简介有时候我们的系统主要是对输入的数据进行处理和转换这些处理和转换是互相独立的在这种情况下输入的数据经过转换之后被放到指定的输出中去。在日常的工作中我们会经常遇到这种数据处理的任务那么对于这样的任务我们就可以采用数据流架构。数据流……

简介

有时候我们的系统主要是对输入的数据进行处理和转换这些处理和转换是互相独立的在这种情况下输入的数据经过转换之后被放到指定的输出中去。

在日常的工作中我们会经常遇到这种数据处理的任务那么对于这样的任务我们就可以采用数据流架构。

数据流架构

在实际工作中的流有很多种最常见的就是I/O流 I / O缓冲区管道等。不同的组件或者模块通过这些流进行连接。数据的流向可以是带有循环的拓扑图没有循环的线性结构或者树形结构等。

数据流架构的主要目的是实现重用和方便的修改。它适用于在顺序定义的输入和输出上进行一系列定义明确的独立数据转换或计算例如编译器和业务数据处理应用程序。一般来说有三种基本的数据流结构。

顺序批处理

顺序批处理是最常见也是最基础的数据流架构。数据作为一个整体会经过一个一个的处理单元在上一个处理单元处理结束之后才会进入到下一个处理单元。

我们看下顺序批处理的流程图

数据被作为一个整体从一个处理器传到另外一个处理器。主要通过临时文件进行交互。每个处理器的输出被作为下一个处理器的输入经过一次次的数据处理最终得到要得的结果。

顺序批处理的优点是每个处理都是独立的他们进行组合得到一个整体的顺序处理架构。

当然缺点就是不能并行只能串行执行吞吐量也不够。各个处理器之间只通过中间文件进行交互交互程度不高。

管道和过滤器

顺序批处理中各个处理器的功能差异比较大通常来说他们是不同的系统。如果在同一个系统中处理数据流任务那么就需要用到管道和过滤器。

java 8引入了stream和管道的概念。一个集合可以转换成stream 通过对stream的操作可以对整个数据流进行变换最终得到想要的结果。

这种方法强调连续组件对数据的增量转换。在这种方法中数据流由数据驱动整个系统可以分解为数据源、过滤器、管道和数据接收器等组件。

模块之间的连接是数据流它是先进/先出的缓冲区可以是字节流、字符流或任何其他类型的此类流。这种架构的主要优点在于它的并发和增量执行。

这种模式下最重要的组件就是过滤器过滤器是独立的数据流转换器。它转换输入数据流的数据对其进行处理并将转换后的数据流写入管道以供下一个过滤器处理。它以增量模式工作一旦数据通过连接的管道到达它就会开始工作。

上图中的数据从管道出发经过一个个的过滤器最终得到处理过后的结果。

过滤器有两种类型分别是主动型过滤器和被动型过滤器。主动型过滤器可以主动从管道中拉取数据并将处理过后的数据推出。这种模式主要用于UNIX 管道。而被动型过滤器则是负责接收管道推入的数据。

这种模式的优点是可以提供高并发和高吞吐量。缺点就是不适合动态交互。

流程控制

还有一种模式既不是批量处理也不是管道模式他是根据输入内容的不同来控制不同的执行流程。类似于我们程序中使用的判断语句。

总结

上面我们介绍了几种数据流的架构方式希望大家能够喜欢。

本文作者 flydean程序那些事

本文链接 http://www.flydean.com/07-data-flow-architecture/

本文来源 flydean的博客

欢迎关注我的公众号:「程序那些事」最通俗的解读最深刻的干货最简洁的教程众多你不知道的小技巧等你来发现

本文转自网络，原文链接：https://developer.aliyun.com/article/784774
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：停车场事故频频，AI 达人将摄像头变身安全卫士 下一篇：没有了

随机推荐

中国信通院李敏：农业数字化转型发展研究

以下文章来源于信息通信技术与政策，作者李敏 1 引言 “三农”工作是党和国家关...
TIOBE 2月榜单出炉，编程语言世界在过去

TIOBE Index for February 2021 有人说，IT行业在不断变化。每天都会有新的IT流...
手把手教你用Python实现Excel中的Vlookup

一、前言大家好，我是崔艳飞。工作中经常会遇到，需要把两张Excel或Csv数据表通...
持续进化 AI 能力，未来企业决胜混合多云

疫情过后，人工智能逐渐从具体应用进化成为企业的一种数字化能力。只有持续进化 ...
2021年低代码开发会成为主流软件开发模式

自1804年穿孔卡片可编程式提花织机问世，编程语言已经存在200多年。人类社会奔涌...
众安保险CTO康德胜：云上保险与众不同 |

来源 | 阿里飞天CIO学堂微信公众号众安保险的数字化跟很多企业的数字化不太一样...
怎么查域名到期时间

怎么查域名到期时间？通常是通过 whois查询进行。 whois 是一个用来域名注册...
2020年中国网络安全产业高峰论坛在京成功

11月30日，由工业和信息化部、北京市人民政府共同主办的2020年中国网络安全产业...
2020年6月国际域名动态：全球十大域名注

根据中国信息通信研究院7月9日发布的《国际域名政策动态》显示，ICANN《2021-2...
整套“金龟子”域名中五位数成交！买家是

TOP云（west.cn）6月22日消息，昨天晚上投资人周峰在朋友圈曝料称，以中五位数...

架构之:数据流架构

推荐图文

安装 Kibana（本地及 Docker）- Elastic Stack 实战

看见新力量NO.01｜专访欣铼能源创始人叶士弘

不容错过！Python列表推导式简明教程

为什么选择b+树作为存储引擎索引结构

详解LongAdder实现原理

数据湖不仅仅是大数据

随机推荐

中国信通院李敏：农业数字化转型发展研究

TIOBE 2月榜单出炉，编程语言世界在过去

手把手教你用Python实现Excel中的Vlookup

持续进化 AI 能力，未来企业决胜混合多云

2021年低代码开发会成为主流软件开发模式

众安保险CTO康德胜：云上保险与众不同 |

怎么查域名到期时间

2020年中国网络安全产业高峰论坛在京成功

2020年6月国际域名动态：全球十大域名注

整套“金龟子”域名中五位数成交！买家是

关于我们