首页 > Python资料 博客日记
Python获取谷歌学术的文献引用量等信息 | scholarly & SerpAPI
2024-11-05 16:00:06Python资料围观181次
摘要:在科研文献管理中,研究人员常常需要维护自己的文献数据库。不同的人可能使用不同的工具来管理文献,例如Excel表格、Notion、飞书等。然而,这些工具往往无法实时更新文章的引用量信息。我通过 scholarly 和 Google Scholar API 两种方法,实现Python自动化脚本获取文章在谷歌学术上的引用量等信息,从而高效地更新自己的文献数据库。
输入:文献标题
输出:文献作者、年份、引用次数等信息
优势:Python批量处理,实现大批量数据库更新
方法一:scholarly(推荐)
Scholarly 是一个 Python 包,用于访问和解析 Google Scholar 的数据。它允许用户自动化地获取学术论文的信息,包括作者、标题、引用次数等。
1. 安装库函数
pip install scholarly
2. 查询单篇文献信息
from scholarly import scholarly
title = 'attention is all you need'
search_query = scholarly.search_single_pub(title)
search_query
3. 其他功能
Scholarly 不仅仅局限于单篇文献信息的查询,还可以根据特定关键字、日期等筛选条件进行高级检索,更多功能请移步至库函数文档:https://github.com/scholarly-python-package
方法二:SerpAPI(Google Scholar API)
SerpAPI 是一个实时 API 服务,它允许用户通过编程方式访问 Google、Bing、Baidu、YouTube 等搜素引擎库的搜索结果,其中提供了 Google Scholar API 的接口访问服务。这个服务处理代理设置、验证码问题,并解析返回的数据为结构化格式,使得用户可以更方便地获取和处理搜索结果,无需处理复杂的爬虫技术或验证码问题。
1. 免费注册 serpapi 账户
注册:登录上述网站、使用 Github、Google 等账户完成注册绑定。
订阅:默认是免费套餐(每个月100次文献查询机会)
私钥:"Your Account" 账户界面找到 "Your Private API Key",后面调用 API 需要用到。
2. 查看 Google Scholar API 接口文档,调用接口查询单篇文献信息
SerpAPI 提供了很多的 API 接口服务,在这里我们只想要 Google Scholar API 接口服务,左侧边栏选择 Google Scholar API,里面给出了详细的 API 参数解释、以及如下图所示调用 API 的代码示意,可以选择 Python、JavaScript、Go 等多种编程语言调用接口。
from serpapi import GoogleSearch
params = {
"engine": "google_scholar",
#q : 想要查询的文献标题/关键词(关键词会返回多篇文献)
"q": "attention is all you need",
#api_key : 填写自己账号的私钥
"api_key": "aaaaaaaaaaaaaaaaaaaaaaaaaaaa"
}
search = GoogleSearch(params)
results = search.get_dict()
organic_results = results["organic_results"]
organic_results[0]
总结
考虑到方法二每个月都有查询的限额(除非氪金),我个人还是倾向于使用 scholarly 进行搜索。
希望本文提供的技巧能够为您的文献管理过程带来便利,让您在探索知识的旅程中,轻松拿捏各个文献。祝愿科研读者们在科研之路上不断取得新的成就!
标签:
相关文章
最新发布
- 光流法结合深度学习神经网络的原理及应用(完整代码都有Python opencv)
- Python 图像处理进阶:特征提取与图像分类
- 大数据可视化分析-基于python的电影数据分析及可视化系统_9532dr50
- 【Python】入门(运算、输出、数据类型)
- 【Python】第一弹---解锁编程新世界:深入理解计算机基础与Python入门指南
- 华为OD机试E卷 --第k个排列 --24年OD统一考试(Java & JS & Python & C & C++)
- Python已安装包在import时报错未找到的解决方法
- 【Python】自动化神器PyAutoGUI —告别手动操作,一键模拟鼠标键盘,玩转微信及各种软件自动化
- Pycharm连接SQL Sever(详细教程)
- Python编程练习题及解析(49题)
点击排行
- 版本匹配指南:Numpy版本和Python版本的对应关系
- 版本匹配指南:PyTorch版本、torchvision 版本和Python版本的对应关系
- Python 可视化 web 神器:streamlit、Gradio、dash、nicegui;低代码 Python Web 框架:PyWebIO
- 相关性分析——Pearson相关系数+热力图(附data和Python完整代码)
- Anaconda版本和Python版本对应关系(持续更新...)
- Python与PyTorch的版本对应
- Windows上安装 Python 环境并配置环境变量 (超详细教程)
- Python pyinstaller打包exe最完整教程