chunjun issues

chunjun 1.12版本，配置了基于zk的ha，提交mysql_binlog sql任务报错

3

以下是报错日志： 2022-06-10 03:58:03.562 [main] INFO org.apache.flink.configuration.GlobalConfiguration - Loading configuration property: jobmanager.rpc.address, localhost 2022-06-10 03:58:03.566 [main] INFO org.apache.flink.configuration.GlobalConfiguration - Loading configuration property: jobmanager.rpc.port, 6123 2022-06-10 03:58:03.566 [main] INFO org.apache.flink.configuration.GlobalConfiguration - Loading...

yangmou

bug

数据需要从mogodb同步到Elasticsearch6.x，是否支持mogodb新增数据读取以及数据写入es中判断数据是否已经存在则删除呢

场景是这样的：需要将业务数据从mogodb同步到Elasticsearch中，mogodb中会不断地有数据新增，并且mogodb会存在更新旧数据的场景，更新的方式是将mogodb中旧数据删除，插入新数据的方式完成更新所有有两个问题想请教一下 1，同步任务执行完成后，任务是否就结束不在同步了？还是说同步任务会处在等待状态，当mogodb有新的数据产生时，会将新数据继续同步过去？ 2，因为使用mogodb更新数据的方式是通过删除旧数据插入新数据的方式来更新数据，那么数据同步到es的时候，也需要通过相同的方式来完成数据的更新，不知道是否支持这样的操作呢? 期待回复，感谢

njian-github

在开启kerberos场景下，修复任务长时间运行connector kerberos票据过期问题

xiuzhu9527

bug

hive2starrocks

2

读取不到hive数据配置如下(配置为太阿生成) [h2star.json.txt](https://github.com/DTStack/chunjun/files/8850513/h2star.json.txt) [err.log](https://github.com/DTStack/chunjun/files/8850482/err.log) 使用spark可以读取 ![image](https://user-images.githubusercontent.com/73087054/172307005-3ca7c065-5775-4519-b83d-07ac2d03688b.png) 另外window本地测试有个小bug BaseHdfsInputFormat 136行文件分隔符为\ 导致后边报错数组越界

xiguadaodao

bug

[Feature] refactor ChunJun-Office-WebSite

refactor chunjun-web : https://dtstack.github.io/chunjun-web/

FlechazoW

feature-request

提供了用于测试的docker镜像

为刚接触chunjun或需要快速使用的同学提供一个docker的镜像。镜像名： ``` dtopensource/chunjun-master ``` 提供了以下可选项： 1. 直接启动，默认使用chunjun-examples/json/stream/stream.json这个任务，standalone模式 ``` docker run -p 8081:8081 dtopensource/chunjun-master ``` 2. 指定文件 /Users/kunni/IdeaProjects/chunjun/chunjun-examples/json/stream/stream.json是在你机器上的文件，docker内挂载的目录必须是/opt/flink/job 任务类型根据文件名自动推断：例如stream.json是sync任务，stream.sql是sql任务 ``` docker run -p 8081:8081 -v /Users/kunni/IdeaProjects/chunjun/chunjun-examples/json/stream/stream.json:/opt/flink/job/stream.json dtopensource/chunjun-master ``` 3. 指定模式...

lvyanquan

enhancement

feature-request

mysql binlog数据同步，数据变更类型字段提取

当使用binlog方式同步数据时，数据库变更记录类型“rowKind”如何作为普通字段提取出来？下面是我通过json配置文件方式的例子： { "job" : { "content" : [ { "reader" : { "parameter" : { "username" : "root", "password" : "123456", "cat" : "insert,delete,update", "jdbcUrl" : "jdbc:mysql://localhost:3306/test_cdc?useSSL=false", "host" :...

13668215435

support elasticsearch6 & support memory prop in yarn per-job mode

3

wwuht

Fix: clickhouse jdbc connect timeout error

2

when I insert a large batch data to clickhouse , this error will appear. ``` DB::Exception: Timeout exceeded: elapsed 5.001140127 seconds, maximum: 5: ```

Kyofin

chunjun 增加自定义函数模块

2

提个想法：是否可以在chunjun项目里增加个flinkx-udfs or chunjun-udfs（udafs/udtfs 名称待定）模块。加这个模块的的作用主要有两点： 1、解决flink 1.12 缺少新版本的一些内置函数，因为永远也跟不上flink 社区版本的节奏。 2、收集汇总常用的udfs ，就算flink 社区开发再快，也有一些没有特性函数，比如nginx ip 查询ip库解析。 3、比如现在版本缺少json内置函数，首先我还要另开项目去开发，开发完还要想办法集成到chunjun里进行测试。 4、待补充，其它优势就不一一列举了各位看看这个想法如何？欢迎补充

libailin

feature-request

chunjun
chunjun copied to clipboard

Metadata

chunjun 1.12版本，配置了基于zk的ha，提交mysql_binlog sql任务报错

数据需要从mogodb同步到Elasticsearch6.x，是否支持mogodb新增数据读取以及数据写入es中判断数据是否已经存在则删除呢

在开启kerberos场景下，修复任务长时间运行connector kerberos票据过期问题

hive2starrocks

[Feature] refactor ChunJun-Office-WebSite

提供了用于测试的docker镜像

mysql binlog数据同步，数据变更类型字段提取

support elasticsearch6 & support memory prop in yarn per-job mode

Fix: clickhouse jdbc connect timeout error

chunjun 增加自定义函数模块

← Metadata

Owner

Metadata

chunjun chunjun copied to clipboard

Metadata

← Metadata

Owner

Metadata

chunjun
chunjun copied to clipboard