Python是一种优秀的编程语言,可以用它轻松获取各种数据。最近,越来越多的人开始使用Python来爬取明星热度,以获取相关信息。
import requests from bs4 import BeautifulSoup url = "https://www.baidu.com/s?ie=UTF-8&wd=%E6%98%8E%E6%98%9F%E7%83%AD%E5%BA%A6" headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3"} r = requests.get(url, headers=headers) soup = BeautifulSoup(r.text, 'html.parser') for tag in soup.find_all("div", class_="result c-container"): title = tag.find(name='a').text href = tag.find(name='a').get('href') abstract = tag.find(name='div', class_="c-abstract").text print(title) print(href) print(abstract)
上面的代码使用requests和BeautifulSoup库,爬取百度搜索结果中的明星热度。我们首先需要找到搜索页面中明星热度相关的标签,这里我们使用class_属性为result c-container的div标签,它在搜索结果中代表每一个搜索条目。
接下来,我们从每一个条目中提取出标题、URL和摘要信息。其中,标题和URL可以通过a标签的text和href属性获取,摘要信息则通过class属性为c-abstract的div标签获取。
最后,我们将获取到的信息打印出来。当然,我们也可以将信息存储在数据库中,实现更复杂的数据分析和可视化。
通过这样的方式,我们可以轻松地获取到明星热度相关的信息,帮助我们更好地了解明星的受欢迎程度。