利用selenium批量获取关键词百度指数

2020-2-24

搞SEO的有时候会遇到批量查询百度指数的需求，但市面上大多数工具查询的数据有延时，并不是实时数据。那有没有更好的方式实时获取百度指数呢?

当然有。那就是利用selenium获取百度指数。得益于百度指数的改版，相对于以前获取百度指数的难度降低不少。改版之前如果想要获取百度指数的话，需要用selenium模拟浏览器，定位到百度指数数据的位置，然后把百度指数数据截图保存，然后利用图像识别技术最终识别出数据，难度比较高。总之一句话，改版后难度小，可以为所欲为。

运行代码之前，需要保证已安装selenium及pyquery库，示例代码如下：

代码示例

from pyquery import PyQuery as pqfrom selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.support import expected_conditions as ECimport time,urllib,random
word_indexs = []
options = webdriver.ChromeOptions()options.add_argument('--headless')  #设置为无界面模式，不然会报错！！options.add_argument(r"--user-data-dir=C:\Users\hp\AppData\Local\Google\Chrome\User Data")  #获取登陆后保持的cookiebrowser = webdriver.Chrome(chrome_options = options)wait = WebDriverWait(browser,5)
for kw in open('keywords.txt',encoding='utf-8-sig'):    kw = kw.rstrip()    word = urllib.parse.quote(kw)    newurl = 'http://index.baidu.com/v2/main/index.html#/trend/{}?words={}'.format(word,word)    browser.get(newurl)    time.sleep(random.uniform(0.5, 1.5))    try:        wait.until(EC.visibility_of_element_located((By.TAG_NAME,'tbody')))  #等到元素可见        html = browser.page_source        doc = pq(html)        indexs = doc('.veui-table').text().split()        # print(indexs)        total_index = indexs[8]        mobile_index = indexs[9]    except:        # print('{}无指数'.format(kw))        total_index = 0        mobile_index = 0    index = '{}\t{}\t{}'.format(kw,total_index,mobile_index)    word_indexs.append(index+'\n')    print(index)
with open('百度指数查询结果.txt','w',encoding='utf-8') as f:    f.writelines(word_indexs)

参数说明

–user-data-dir：修改成电脑Chrome浏览器User Data文件夹所在路径

keywords.txt：关键词存放文件，一行一个

什么?你还想知道百度指数改版前的获取方法?我也不会，不过有代码参考，一并奉上。见：https://github.com/plus0318/BaiduIndex

阅读剩余

THE END

SEO一本道-技术研发的百度SEO规范

社群运营到底要做什么？

thumbnail

[快讯]Google 2025年6月核心更新已发布

Google 昨晚发布了 2025 年 6 月核心算法更新（June 2025 core update），这也是今年第二次核心算法更新，预计 3 周发布完成。影响和应对本次算法更新并没……

2025-07-01 流光啸月

0 0

thumbnail

浅析Google AI Mode的查询扩展技术（Query Fan-Out）附带免费工具

上篇提到 Google 上线了 AI 模式，在 Google 搜索框中直接加入了 “AI Mode" 的按钮，并且新增了 “AI Mode” 的搜索类型。通过对 AI Mode 功能和原理的了解，……

2025-06-24 流光啸月

0 0

thumbnail

外链建设不要再依赖DA了，AS值才是正道

在2025年谷歌算法进一步强化EEAT（经验、专业性、权威性、可信度）和用户体验权重的背景下，传统依赖DA值的外链建设策略正在失效。为什么传统DA依赖正在……

2025-06-16 流光啸月

0 0

thumbnail

关于Youtube视频社区的SEO规范指南

关于Youtube视频社区网站的SEO规范指南包含2部分：视频本身可控SEO因素布局，和不可控SEO排名因素。可控的SEO因素需尽量做到规范性，不可控因素可向规范性看……

2025-06-10 流光啸月

0 0

thumbnail

5月14日谷歌算法风暴：4大实战技巧，我如何规避Spam内容“雪崩”

发生在今年5月中旬，Google排名算法大清洗行动，让很多外贸独立站都横遭不测。自然流量和关键词数据，一落千丈。本次事故，其实Google已经针对AI搜索（GEO）……

2025-06-06 流光啸月

0 0

thumbnail

产品页面SEO解密：20天+关键词与内容SEO优化【2025实操篇】

今天，我来分享：我如何一步步运用SEO优化，并且制作高质量Product内容，获取Google自然流量。第一步：挖掘用户搜索意图创建一个产品页面之前，我首先会搞……

2025-06-05 流光啸月

0 0

thumbnail

SEO工具：Webfx 文本易懂性检测工具及6个相关性工具

Webfx网站上文本内容易懂性检测工具是一个免费在线可读性检测工具，无需注册，可以快速评估英文文本的可读性得分，可以输入一个网页URL，工具会自动抓取并分析……

2025-06-01 流光啸月

0 0

thumbnail

Daniel：如何获得AIO搜索结果详细教程

最近直播间提问和SEO群里讨论AIO的内容越来越多，也可以想象得到大家对与AI出来是否会取代原来的搜索引擎等方面有所焦虑而其实翻看互联网上的文章，很多都是……

2025-05-29 流光啸月

0 0

thumbnail

SERP搜索展现系列（一）：我如何运用Featured Snippet累计猎取114.3K自然流量

今天，我将实操讲解：我如何运用Featured Snippet（精选摘要）策略，在收获了20.4K关键词情况下，累计猎取114.3K谷歌自然流量。一、什么是SERP搜索展现？ SER……

2025-05-22 流光啸月

0 0

thumbnail

Google搜索迎来AI模式还有深度搜索等新功能

昨晚 Google 在 I/O 大会上宣布，AI 模式已面向所有美国地区的用户开放，不需要实验功能即可使用（只是美国地区、英语语言开放）。这就意味着经典的Google 首……

2025-05-21 流光啸月

0 0