Apache Flink原理

发表于 2019-05-12 | 分类于 big-data |

阅读时长 ≈ 1 mins.

Flink是Apache下的一款分布式的计算引擎，它的亮点在于处理实时数据流（无界数据流），实时地产生数据的结果；当然，通过划分窗口（时间窗口等）同样适用于批处理（有界数据流）。想想Spark streaming也可以处理实时数据呀，那为什么会诞生flink呢？flink与spark相比有哪些特色？下文将逐个介绍这些内容。

flink Vs. spark

更多比较见美图数据团队的文章Spark Streaming VS Flink

架构

[TODO]

任务执行过程

[TODO]

实践

使用brew安装
1
brew install apache-flink

使用docker-compose部署

version: "2.1"
services:
jobmanager:
    image: ${FLINK_DOCKER_IMAGE_NAME:-flink}
    expose:
    - "6123"
    ports:
    - "8081:8081"
    command: jobmanager
    environment:
    - JOB_MANAGER_RPC_ADDRESS=jobmanager

taskmanager:
    image: ${FLINK_DOCKER_IMAGE_NAME:-flink}
    expose:
    - "6121"
    - "6122"
    depends_on:
    - jobmanager
    command: taskmanager
    links:
    - "jobmanager:jobmanager"
    environment:
    - JOB_MANAGER_RPC_ADDRESS=jobmanager

本文作者： ljchen
本文链接： http://ljchen.net/2019/05/12/Apache-Flink原理/
版权声明： 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 3.0 许可协议。转载请注明出处！

0%