以下三条记录源于5台机器导入近3亿条文档1.集群压力大,某台机器失去“心跳”后,其他机器好像总找不回它,导致数据无法继续传输查看日志,是说9300拒绝连接,想不明白,怎么会拒绝连接?很显然与防火墙无关,果然,关了防火墙依然有出现这种情况的可能。【我感觉还是9300的写入压力太大?】目前既没有找到好的解释,也没有好的解决办法目前的解决办法是:将bulk提交的request——timeout设置得很大,比如600秒,retries数也设置大一些,比如说100次。这样一来,集群不可用时,自己的代码程序不会退出。因为代码退出代价很大,你不知道什么时候集群失效了,数据传输到了哪些文件的哪些位置,重来又太
1