首页 1 2 3 4 5 6 7

Apache Flink和Kafka入门

介绍

Apache Flink是用于分布式流和批处理数据处理的开源平台。 Flink是具有多个API的流数据流引擎，用于创建面向数据流的应用程序。

Flink应用程序通常使用Apache Kafka进行数据输入和输出。本文将指导您逐步使用Apache Flink和Kafka。

先决条件

Apache Kafka 0.9.x
吉特
Maven 3.x或更高版本

创建您的Flink流项目

第一步是创建Java应用程序，最简单的方法是使用flink-quickstart-java原型，该原型包含核心依赖关系和打包任务。本文与 Apache Flink快速入门示例相似，重点明确介绍了MapR Streams的数据输入和输出。

在此应用程序中，我们将创建两个作业：

WriteToKafka ：生成随机字符串，然后使用Kafka Flink连接器及其Producer API将其发布到MapR Streams主题。
ReadFromKafka ：读取相同的主题，并使用Kafka Flink连接器及其使用方在标准输出中显示消息。 API。

完整项目可在GitHub上找到：

Flink和Kakfa应用

让我们使用Apache Maven创建项目：

mvn archetype:generate \
      -DarchetypeGroupId=org.apache.flink\
      -DarchetypeArtifactId=flink-quickstart-java \
      -DarchetypeVersion=1.1.2 \
      -DgroupId=com.grallandco.demos \
      -DartifactId=kafka-flink-101 \
      -Dversion=1.0-SNAPSHOT \
      -DinteractiveMode=false

Maven将创建以下结构：

tree kafka-flink-101/
kafka-flink-101/
├── pom.xml
└── src
    └── main
        ├── java
        │   └── com
        │       └── grallandco
        │           └── demos
        │               ├── BatchJob.java
        │               ├── SocketTextStreamWordCount.java
        │               ├── StreamingJob.java
        │               └── WordCount.java
        └── resources
            └── log4j.properties

7 directories, 6 files

该项目被配置为创建一个Jar文件，该文件包含您的flink项目代码，还包括运行该文件所需的所有依赖项。

该项目包含其他一些示例工作，本文不需要它们，您可以将其用于教育目的，也可以将其从项目中删除。

添加Kafka连接器

打开pom.xml并将以下依赖项添加到您的项目中：

第一步，我们必须添加Flink Kafka连接器作为依赖项，以便我们可以使用Kafka接收器。将此添加到“依赖项”部分的pom.xml文件中：

您现在必须添加Flink Kafka Connector依赖项才能使用Kafka接收器。在<dependencies>元素中添加以下条目：

<dependency>
      <groupId>org.apache.flink</groupId>
      <artifactId>flink-connector-kafka-0.9_2.10</artifactId>
      <version>${flink.version}</version>
 </dependency>

现在，Flink项目已准备就绪，可以通过Kafka连接器使用DataStream，因此您可以从Apache Kafka发送和接收消息。

安装并启动Kafka

下载Kafka，在终端中输入以下命令：

curl -O http://www.us.apache.org/dist/kafka/0.9.0.0/kafka_2.11-0.9.0.0.tgz
tar -xzf kafka_2.11-0.9.0.0.tgz
cd kafka_2.11-0.9.0.0

Kafka使用ZooKeeper，如果您没有运行Zookeeper，则可以使用以下命令启动它：

./bin/zookeeper-server-start.sh config/zookeeper.properties

通过在新终端中运行以下命令来启动Kafka代理：

./bin/kafka-server-start.sh config/server.properties

在另一个终端中，运行以下命令来创建一个名为flink-demo的Kafka主题：

./bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic flink-demo

使用Kafka工具将消息发布和使用到flink-demo主题。

制片人

./bin/kafka-console-producer.sh --broker-list localhost:9092 --topic flink-demo

消费者

./bin/kafka-console-consumer.sh --zookeeper localhost:2181 --topic flink-demo --from-beginning

在生产者窗口中，您可以发布一些消息，并在消费者窗口中查看它们。我们将使用这些工具来跟踪Kafka和Flink之间的交互。

编写您的Flink应用程序

现在让我们使用Flink Kafka Connector将消息发送到Kafka并使用它们。

制片人

生产者使用SimpleStringGenerator()类生成消息，并将该字符串发送到flink-demo主题。

public static void main(String[] args) throws Exception {
    StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

    Properties properties = new Properties();
    properties.setProperty("bootstrap.servers", “localhost:9092"); 

    DataStream<String> stream = env.addSource(new SimpleStringGenerator());
    stream.addSink(new FlinkKafkaProducer09<>("flink-demo", new SimpleStringSchema(), properties));

    env.execute();
  }

SimpleStringGenerator()方法代码在此处可用。

主要步骤是：

在任何Flink应用程序的基础上创建一个新的StreamExecutionEnvironment
在应用程序环境中创建一个新的DataStream时， SimpleStringGenerator类将Flink中所有流数据源的Source接口实现SourceFunction 。
将FlinkKafkaProducer09器添加到主题。

消费者

使用者只需从flink-demo主题中读取消息，然后将它们打印到控制台中即可。

public static void main(String[] args) throws Exception {
    // create execution environment
    StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

    Properties properties = new Properties();
    properties.setProperty("bootstrap.servers", “localhost:9092");
    properties.setProperty("group.id", "flink_consumer");

    DataStream<String> stream = env.addSource(new FlinkKafkaConsumer09<>(
        "flink-demo", new SimpleStringSchema(), properties) );

    stream.map(new MapFunction<String, String>() {
      private static final long serialVersionUID = -6867736771747690202L;

      @Override
      public String map(String value) throws Exception {
        return "Stream Value: " + value;
      }
    }).print();

    env.execute();
  }

主要步骤是：

在任何Flink应用程序的基础上创建一个新的StreamExecutionEnvironment
使用消费者信息创建一组属性，在此应用程序中，我们只能设置消费者group.id 。
使用FlinkKafkaConsumer09从主题flink-demo获取消息

生成并运行应用程序

让我们直接从Maven（或从您最喜欢的IDE）运行应用程序。

1-建立专案：

$ mvn clean package

2-运行Flink生产者作业

$ mvn exec:java -Dexec.mainClass=com.mapr.demos.WriteToKafka

3-运行Flink消费者工作

$ mvn exec:java -Dexec.mainClass=com.mapr.demos.ReadFromKafka

在终端中，您应该看到生产者生成的消息

现在，您可以在Flink群集上部署并执行此作业。

结论

在本文中，您学习了如何将Flink与kafka结合使用来写入和读取数据流。

翻译自: https://www.javacodegeeks.com/2016/10/getting-started-apache-flink-kafka.html

js中css压缩方法

最近一直在做邮件html发送。其中邮件排版中，很多邮箱对css大小有要求，必需要有压缩css的办法，以前的做法是去各大在线压缩工具中压缩好后，再加入邮件html中。随着邮件html模板越做越多后，这个压缩就很繁琐，为了解决这类问题，就开始寻找css压缩的办法。纯js写的css

VS + Qt实现上位机串口通信：环境搭建

VS安装 + Qt安装：按照官方提示的步骤就可以了。下载安装结束后 1，打开VS——扩展——管理扩展——搜索Qt Visual Studio Tools——安装 2，扩展——Qt VS Tools——Qt Project settings——Qt

tensorflow编程一般思路

小白编程，时常看tf代码看得头痛，也没有自己的一点思路。今天就结合网上的一些资料以及我自己的一个代码，整理了一下tensorflow编程一般思路。一般我们从GitHub上下载的tensorflow的代码文档，主要包含如下几个文件：

Python 访问 PostgreSQL

实验2-Nios-II入门实践

一、硬件部分设计 1、实验目的（1）学习 Quartus Prime 、Platform Designer、Nios II SBT 的基本操作；（2）初步了解 SOPC 的开发流程，基本掌握

redis事务对比Lua脚本区别是什么

redis官方对于lua脚本的解释：Redis使用同一个Lua解释器来执行所有命令，同时，Redis保证以一种原子性的方式来执行脚本：当lua脚本在执行的时候，不会有其他脚本和命令同时执行，这种语义类似于 MULTI/EXEC。从别的客户端的视角来看，一个lua脚本要么不可见，要么已经执行完

VUE使用ElementUI下拉框 @change事件数据不回显

问题在VUE中使用ElementUI的el-select下拉框，它是通过接口异步获取的下拉框数据，选择某一个值后，虽然在绑定的 @change 事件中能够看到已赋值成功，控制台输出也显示赋值操作完成数据变化，但是框上却没有显示选中的值。解决方案

AJAX跨域问题

AJAX跨域问题跨域介绍什么是跨域跨到不同的域名（服务器）之间的相互的资源访问。当协议、域名、端口号，任一一个不相同，即他们

练练python, 推荐两个实践方式

1.The Python Challenge

SpringSecurity：CSRF攻击

实验0：SpringSecurity默认开启CSRF防护现在我们在springboot-security项目的Hello