Taier
Taier copied to clipboard
[Bug] [多集群管理] 唯独hdfs无法验证通过,其他都可以。
Search before asking
- [X] I had searched in the issues and found no similar issues.
What happened
在配置HDFS 存储组件过程中,上传Kerberos 的zip时出现Kerberos无法登录的情况。但是我自己单独搭建flink 1.13.5时,Kerberos是可以连通的。提示:Kerberos 的zip包里有:krb5.conf 和 nn.service.keytab 两个文件。方便的话,你们可以提供相关实例,我参考下。
截图如下:
错误是:
What you expected to happen
我觉得是 taier 对 Kerberos 文件处理有问题 ,或者是我传的的kerberos有文件不对。
How to reproduce
你们可以在多集群管理里面配置下HDFS, 看看是否可以重新。如果通过,可以提供建议给我们。
Anything else
No response
Version
v.12
Are you willing to submit PR?
- [ ] Yes I am willing to submit a PR!
Code of Conduct
- [X] I agree to follow this project's Code of Conduct
hdfs的配置xml文件能贴一下么
hdfs的配置xml文件能贴一下么
(1)kerberos zip文件: taier-kerberos.zip (2)hdfs的xml文件: taier-hdfs.zip
相关文件已经发你了,请核对。
com.dtstack.taier.hdfs.DtHdfsClient#checkHdfsConnect
等跟下这个地方181行 具体什么npe了
我看你的文件配置项是有的 应该不是配置项问题
那是不是Kerberos的问题?Kerberos文件也发你了,麻烦核实下和你们测试时啥区别。
你的集群我访问不了
本地测试没有出现你截图的这个问题
什么情况下会有mergekerb5.conf 文件呢? 估计是Kerberos认证失败导致的。另外我的HDFS的 nn.service.keytab文件名称和格式对吗?对taier来说。
点击过kerbero的编辑按钮就会有,可以删除掉keytab 在上传直接报错再试试
如果还是有点话 建议debug看下 具体的报错问题
请查看文 scheduler.zip
curl --location --request GET 'http://172.16.85.215:18088/ws/v1/cluster/scheduler'
--header 'Accept: application/json'
--header 'Accept-Language: zh-CN,zh;q=0.9'
--header 'Cache-Control: max-age=0'
--header 'Connection: keep-alive'
--header 'Cookie: __utmc=182792038; __utmz=182792038.1654825563.1.1.utmcsr=(direct)|utmccn=(direct)|utmcmd=(none); __utma=182792038.1832709514.1654825563.1654825563.1654833206.2; hadoop.auth=; CLOUDERA_MANAGER_SESSIONID=node0rjwbnr4l15pfs530mnpbao4519706.node0'
--header 'Upgrade-Insecure-Requests: 1'
--header 'User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/102.0.0.0 Safari/537.36'
--header 'Content-Type: application/json'
@wangzhen-wudangshan 能麻烦改下ip 吧对应的json发我么
请查收josn文件 myjson.zip
队列是正常解析的
建议debug下 com.dtstack.taier.yarn.DtYarnClient#getClusterResource
或者看下日志里面有没有对应 错误日志信息
@wangzhen-wudangshan