利用selenium批量获取关键词百度指数

2020-2-24

搞SEO的有时候会遇到批量查询百度指数的需求，但市面上大多数工具查询的数据有延时，并不是实时数据。那有没有更好的方式实时获取百度指数呢?

当然有。那就是利用selenium获取百度指数。得益于百度指数的改版，相对于以前获取百度指数的难度降低不少。改版之前如果想要获取百度指数的话，需要用selenium模拟浏览器，定位到百度指数数据的位置，然后把百度指数数据截图保存，然后利用图像识别技术最终识别出数据，难度比较高。总之一句话，改版后难度小，可以为所欲为。

运行代码之前，需要保证已安装selenium及pyquery库，示例代码如下：

代码示例

from pyquery import PyQuery as pqfrom selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.support import expected_conditions as ECimport time,urllib,random
word_indexs = []
options = webdriver.ChromeOptions()options.add_argument('--headless')  #设置为无界面模式，不然会报错！！options.add_argument(r"--user-data-dir=C:\Users\hp\AppData\Local\Google\Chrome\User Data")  #获取登陆后保持的cookiebrowser = webdriver.Chrome(chrome_options = options)wait = WebDriverWait(browser,5)
for kw in open('keywords.txt',encoding='utf-8-sig'):    kw = kw.rstrip()    word = urllib.parse.quote(kw)    newurl = 'http://index.baidu.com/v2/main/index.html#/trend/{}?words={}'.format(word,word)    browser.get(newurl)    time.sleep(random.uniform(0.5, 1.5))    try:        wait.until(EC.visibility_of_element_located((By.TAG_NAME,'tbody')))  #等到元素可见        html = browser.page_source        doc = pq(html)        indexs = doc('.veui-table').text().split()        # print(indexs)        total_index = indexs[8]        mobile_index = indexs[9]    except:        # print('{}无指数'.format(kw))        total_index = 0        mobile_index = 0    index = '{}\t{}\t{}'.format(kw,total_index,mobile_index)    word_indexs.append(index+'\n')    print(index)
with open('百度指数查询结果.txt','w',encoding='utf-8') as f:    f.writelines(word_indexs)

参数说明

–user-data-dir：修改成电脑Chrome浏览器User Data文件夹所在路径

keywords.txt：关键词存放文件，一行一个

什么?你还想知道百度指数改版前的获取方法?我也不会，不过有代码参考，一并奉上。见：https://github.com/plus0318/BaiduIndex

阅读剩余

THE END

SEO一本道-技术研发的百度SEO规范

社群运营到底要做什么？

thumbnail

为什么你的内容不会被 AI 选中？从 GEO 视角看生成式引擎的内容筛选逻辑

很多人在做 GEO（Generative Engine Optimization）时都有一个困惑：明明按 SEO 的思路在做内容，关键词也有，结构也不差，但在 ChatGPT、Claude、豆包、通义……

2026-01-22 流光啸月

0 0

thumbnail

Google UCP 发布：电商 GEO 的新基建（Feed + Schema + API）

前言几天前，Google 宣布推出通用商务协议（UCP，Universal Commerce Protocol），这是“一种覆盖整个购物旅程的代理式电商新开放标准”。通过这个协议，……

2026-01-16 流光啸月

0 0

thumbnail

GEO 技术端优化实战指南：案例+工具+免费检查清单

上周有幸参加英文 SEO 实战派的年终活动，做了GEO的分享，回来后梳理了思路在这里整理下；顺便说下，英文 SEO 实战派的活动有很多干货，我自己也收获颇多，……

2026-01-05 流光啸月

0 0

thumbnail

为什么大模型会“偷懒”：GEO内容优化的底层逻辑

在人工智能时代，我们与大模型的互动中常有一种体验：它有时会回避复杂问题，给出笼统、保守甚至未完成的回答。这种现象，我们称之为大模型的“偷懒”。然而，……

2025-10-30 流光啸月

0 0

thumbnail

Google 内部文档的深度解析：核心指标、排名系统、EEAT以及检查清单

背景和声明本文是 Shaun Anderson基于 Google 在 2024 年泄漏的内容数据仓库的逆向分析，纯粹是他的深度分析推理得来，并非官方公布，所以并不是完全准确……

2025-10-21 流光啸月

0 0

thumbnail

SEO每周一见：Google称SEO点击没有减少｜电商搜索结果24年vs25年｜GEO工具评测和推荐

Google：搜索到网站的总点击没变，点击质量有提升面对“SEO已死”、“零点击”等影响信心的讨论，Google 在官方博客中正面回应： 1、Google 搜索到网站的总点击……

2025-08-13 流光啸月

0 0

thumbnail

有需求先问AI？当AI搜索成习惯，企业如何做好GEO优化，赢得AI推荐？

“帮我推荐一款预算十五万的车，城市通勤需要” “北京市装修公司推荐，请分别列举优势、费用、口碑信息” “牙齿发黄，有什么科学美白办法？” 距离DeepSe……

2025-08-13 流光啸月

0 0

thumbnail

AI检索中线上获客的运营重构——GEO战略定位

先聊一个很多老板都头疼的问题：为什么公司在线上推广的钱越花越多，询盘电话却越来越少？花钱做了网站，优化了百度排名，甚至投了信息流广告……

2025-08-13 流光啸月

0 0

thumbnail

会展人必修课：如何用FQA“问答页面”，喂饱AI，抢占客户心智

咱们拆解过GEO落地的五步法。但理论归理论，真要动手，很多人第一个就卡在了“内容”这一关。今天，我就给你指一条“捷径”，一个最适合我们这些……

2025-08-12 流光啸月

0 0

thumbnail

什么是GEO VS SEO？

什么是 GEO（生成引擎优化）？ GEO，全称 Generative Engine Optimization，中文叫生成式引擎优化。它不是为传统搜索引擎准备的，而是为生成式 AI 搜索做的……

2025-08-11 流光啸月

0 0