Elasticsearch 数据到处到本地

直接上代码吧

# -*- coding: utf-8 -*-

from elasticsearch import Elasticsearch


# 日志的配置环境
import platform
import logging.handlers
sys_platform = platform.system()
if sys_platform == "Windows":
    LOG_FILE_check = './app_cic.txt'
else:
    LOG_FILE_check = '/cic1.log'
handler = logging.handlers.RotatingFileHandler(LOG_FILE_check, maxBytes=1200 * 1024 * 1024,backupCount=10)  # 实例化handler  200M 最多十个文件
fmt = '\n' + '%(message)s'
formatter = logging.Formatter(fmt)  # 实例化formatter
handler.setFormatter(formatter)  # 为handler添加formatter
logger = logging.getLogger('check')  # 获取名为tst的logger
logger.addHandler(handler)  # 为logger添加handler
logger.setLevel(logging.DEBUG)


# es = Elasticsearch()
es = Elasticsearch(["20.0.0.11:9200"], sniff_on_start=True, sniff_on_connection_fail=True,sniff_timeout=60)

import time

query_json = {
    "query":{
        "terms":{
            "site":[
                "百度搜索"
            ]
        }

    }
}



page_num = 1000  # 每次获取数据
query = es.search(index='guoyan_index_v1', body=query_json, scroll='5m', size=page_num)
results = query['hits']['hits']  # es查询出的结果第一页
total = query['hits']['total']  # es查询出的结果总量
scroll_id = query['_scroll_id']  # 游标用于输出es查询出的所有结果
every_num = int(total/page_num)  #
# print(results)
print("total",total)
print("scroll_id",scroll_id)
print("every_num",every_num)

alist = []
end_data_list = []
print("----------",int(total/page_num)+1)
for i in range(0, every_num):
# for i in range(100, 1000):
    print("正在读取的位置是：",i)
    results_list = es.scroll(scroll_id=scroll_id, scroll='5m')['hits']['hits']
    for key in results_list:
        try:
            source = key['_source']["source"]
            other6 = key['_source']["other6"]
            result_str = other6 + " " + source
            end_data_list.append(result_str)
        except:
            pass
end_data_list = list(set(end_data_list))
print("去重以后的数据是条数是：",len(end_data_list))
for end_data in end_data_list:
    logger.info(end_data)

spring cloud -- eureka主动停止和恢复服务

在我们使用springcloud开发中,由于有很多开发人员同时开发,当他们注册服务的时候,难免会将别的服务注册在我们当前的注册中心,此时我们可以主动将其服务下线可以通过postman发送PUT请求:

Anaconda搭建深度学习虚拟环境：cuda+cudnn+pytorch+torchvision（并验证）

搭建深度学习虚拟环境（Anaconda）

chrome扩展开发资料

chrome插件最新版本开发指南来了 https://blog.csdn.net/qq_34998786/article/details/121782426? https://juejin.cn/post/7051466934948200461 ht

ajax读取文件数据,Ajax 实现读取 properties 格式资源文件数据

Ajax 的核心是 JavaScript 对象 XmlHttpRequest。该对象在 Internet Explorer 5 中首次引入，它是一种支持异步请求的技术。简而言之，XmlHttpRequest 使您可以使用 JavaScript 向服务器提出请求并处理响应，而不阻塞

使用IDEA+Maven创建JavaWeb项目并运行第一个Servlet

环境准备： IDEA 2021Maven 3.6.3Tomcat9 创建项目打开IDEA新建项目

苹果home键在哪里设置_苹果的"home"键美观的开始，却耽误了全面屏的创新，怀念吗？...

随着手机全面屏的发展，苹果的"home"键似乎没有那么多人追逐了。要知道苹果的"home"键，它会带你回到你所在的地方，不仅给用户带来体验上便捷，还成为了iPhone手机标志性的面孔。如今，"home"键却在慢慢退出苹果的历史舞台，留给我们的就只剩下缅怀了。

【云原生】Kubernetes之Secret

使用 kubectl 管理 Secret 准备开始你必须拥有一个 Kubernetes 的集群，同时你必须配置 kubectl 命令行工具与你的集群通信

3D【11】人脸重建：Disentangling Features in 3D Face Shapes for Joint Face Reconstruction and Recognition

这篇文章的思想跟Multilinear Autoencoder for 3D

39. Python 多线程实例多线程锁

1.多线程多线程

如何解决Unsupported major.minor version 52.0问题？

为什么出现Unsupported major.minor version 52.0？ You get this error because

Elasticsearch 数据 到处到本地

Elasticsearch 数据到处到本地