Flink 入门笔记(1)
好友投稿,整理自慕课网及同事分享
初识Flink
- 什么是Flink:基于有界和无界数据流的有状态的计算,分布式计算引擎
- 无界数据流:有开始没有结尾,流处理实时处理
- 有界数据流:有开始有结尾,用批处理处理有界数据流
- Flink提供的三个层级的API:
- SQL/Table API(使用sql语句)
- DataStream API
- ProcessFunction
- 什么是Flink:基于有界和无界数据流的有状态的计算,分布式计算引擎
A Coder,a Programmer,a Developer
好友投稿,整理自慕课网及同事分享
初识Flink
参考网站:阿里云 机器学习 PAI
主要参考:极客时间专栏:数据结构与算法之美 45 | 位图:如何实现网页爬虫中的URL去重功能?
应用场景:爬虫爬网页时,要避免重复爬取,对网页去重。
需要暴露的api:add()和isExisted(),即插入跟查询操作。
要求:① 查询、插入效率高;② 省内存。
使用位图的思路:
英文原文地址:A FIRST LOOK INTO ZGC
网友译文:ZGC窥探
ZGC好文推荐: Oracle 发布全新的 Java 垃圾收集器 ZGC
The Z Garbage Collector (ZGC) 【2】
Per 大大写的官方 PPT:The Z Garbage Collector An Introduction