首页 > Python资料 博客日记
Python获取谷歌学术的文献引用量等信息 | scholarly & SerpAPI
2024-11-05 16:00:06Python资料围观45次
摘要:在科研文献管理中,研究人员常常需要维护自己的文献数据库。不同的人可能使用不同的工具来管理文献,例如Excel表格、Notion、飞书等。然而,这些工具往往无法实时更新文章的引用量信息。我通过 scholarly 和 Google Scholar API 两种方法,实现Python自动化脚本获取文章在谷歌学术上的引用量等信息,从而高效地更新自己的文献数据库。
输入:文献标题
输出:文献作者、年份、引用次数等信息
优势:Python批量处理,实现大批量数据库更新
方法一:scholarly(推荐)
Scholarly 是一个 Python 包,用于访问和解析 Google Scholar 的数据。它允许用户自动化地获取学术论文的信息,包括作者、标题、引用次数等。
1. 安装库函数
pip install scholarly
2. 查询单篇文献信息
from scholarly import scholarly
title = 'attention is all you need'
search_query = scholarly.search_single_pub(title)
search_query
3. 其他功能
Scholarly 不仅仅局限于单篇文献信息的查询,还可以根据特定关键字、日期等筛选条件进行高级检索,更多功能请移步至库函数文档:https://github.com/scholarly-python-package
方法二:SerpAPI(Google Scholar API)
SerpAPI 是一个实时 API 服务,它允许用户通过编程方式访问 Google、Bing、Baidu、YouTube 等搜素引擎库的搜索结果,其中提供了 Google Scholar API 的接口访问服务。这个服务处理代理设置、验证码问题,并解析返回的数据为结构化格式,使得用户可以更方便地获取和处理搜索结果,无需处理复杂的爬虫技术或验证码问题。
1. 免费注册 serpapi 账户
注册:登录上述网站、使用 Github、Google 等账户完成注册绑定。
订阅:默认是免费套餐(每个月100次文献查询机会)
私钥:"Your Account" 账户界面找到 "Your Private API Key",后面调用 API 需要用到。
2. 查看 Google Scholar API 接口文档,调用接口查询单篇文献信息
SerpAPI 提供了很多的 API 接口服务,在这里我们只想要 Google Scholar API 接口服务,左侧边栏选择 Google Scholar API,里面给出了详细的 API 参数解释、以及如下图所示调用 API 的代码示意,可以选择 Python、JavaScript、Go 等多种编程语言调用接口。
from serpapi import GoogleSearch
params = {
"engine": "google_scholar",
#q : 想要查询的文献标题/关键词(关键词会返回多篇文献)
"q": "attention is all you need",
#api_key : 填写自己账号的私钥
"api_key": "aaaaaaaaaaaaaaaaaaaaaaaaaaaa"
}
search = GoogleSearch(params)
results = search.get_dict()
organic_results = results["organic_results"]
organic_results[0]
总结
考虑到方法二每个月都有查询的限额(除非氪金),我个人还是倾向于使用 scholarly 进行搜索。
希望本文提供的技巧能够为您的文献管理过程带来便利,让您在探索知识的旅程中,轻松拿捏各个文献。祝愿科研读者们在科研之路上不断取得新的成就!
标签:
相关文章
最新发布
- 【Python】selenium安装+Microsoft Edge驱动器下载配置流程
- Python 中自动打开网页并点击[自动化脚本],Selenium
- Anaconda基础使用
- 【Python】成功解决 TypeError: ‘<‘ not supported between instances of ‘str’ and ‘int’
- manim边学边做--三维的点和线
- CPython是最常用的Python解释器之一,也是Python官方实现。它是用C语言编写的,旨在提供一个高效且易于使用的Python解释器。
- Anaconda安装配置Jupyter(2024最新版)
- Python中读取Excel最快的几种方法!
- Python某城市美食商家爬虫数据可视化分析和推荐查询系统毕业设计论文开题报告
- 如何使用 Python 批量检测和转换 JSONL 文件编码为 UTF-8
点击排行
- 版本匹配指南:Numpy版本和Python版本的对应关系
- 版本匹配指南:PyTorch版本、torchvision 版本和Python版本的对应关系
- Python 可视化 web 神器:streamlit、Gradio、dash、nicegui;低代码 Python Web 框架:PyWebIO
- 相关性分析——Pearson相关系数+热力图(附data和Python完整代码)
- Python与PyTorch的版本对应
- Anaconda版本和Python版本对应关系(持续更新...)
- Python pyinstaller打包exe最完整教程
- Could not build wheels for llama-cpp-python, which is required to install pyproject.toml-based proj