跳到主要内容
版本:Candidate-3.4

MySQL 实时同步至 StarRocks 常见问题

报错提示Could not execute SQL statement. Reason:org.apache.flink.table.api.ValidationException: One or more required options are missing.

原因分析:在 SMT 配置文件 config_prod.conf 中设置了多组规则[table-rule.1][table-rule.2]等但是缺失必要的配置信息。

解决方式:检查是否给每组规则[table-rule.1][table-rule.2]等配置 database,table和 flink connector 信息。

Flink 通过 Checkpointing 机制重启策略,自动重启失败的 Task。

例如,您需要启用 Checkpointing 机制,并且使用默认的重启策略,即固定延时重启策略,则可以在配置文件flink-conf.yaml进行如下配置。

# unit: ms
execution.checkpointing.interval: 300000
state.backend: filesystem
state.checkpoints.dir: file:///tmp/flink-checkpoints-directory

参数说明:

Flink 官网文档的参数说明,请参见 Checkpointing

  • execution.checkpointing.interval: Checkpoint 的基本时间间隔,单位为 ms。如果需要启用 Checkpointing 机制,则您需要设置该值为大于 0。

  • state.backend:启动 Checkpointing 机制后,状态会随着 CheckPoint 而持久化,以防止数据丢失、保障恢复时的一致性。 状态内部的存储格式、状态在 CheckPoint 时如何持久化以及持久化在哪里均取决于选择的 State Backend。状态更多介绍,请参见 State Backends

  • state.checkpoints.dir:Checkpoint 数据存储目录。

可以在停止 Flink job 时手动触发 savepoint(savepoint是依据 Checkpointing 机制所创建的流作业执行状态的一致镜像),后续可以从指定 savepoint 中恢复flinkjob。

  1. 使用 Savepoint 停止作业。这将自动触发 Flink job jobId 的 savepoint,并停止该 job。此外,你可以指定一个目标文件系统目录来存储 Savepoint 。

    bin/flink stop --type [native/canonical] --savepointPath [:targetDirectory] :jobId

    说明

    • jobId: 您可以通过 Flink WebUI 查看 Flink job ID,或者在命令行执行flink list –running 进行查看。
    • targetDirectory: 您也可以在 Flink 配置文件 flink-conf.ymlstate.savepoints.dir 配置 savepoint 的默认目录。 触发 savepoint 时,将使用此目录来存储 savepoint,无需指定目录。
    state.savepoints.dir: [file://或hdfs://]/home/user/savepoints_dir
  2. 如果需要恢复 Flink job 至停止前的状态,则您需要在重新提交 Flink job 时指定savepoint。

    ./flink run -c com.starrocks.connector.flink.tools.ExecuteSQL -s savepoints_dir/savepoints-xxxxxxxx flink-connector-starrocks-xxxx.jar -f flink-create.all.sql