原神爬虫抓取原神界面圣遗物信息

Last update: Oct 10, 2022

Related tags

Web Crawling GenshinSpider

Overview

原神圣遗物半自动爬虫

说明

直接抓取原神界面中的圣遗物数据

目前只适配了背包页面的抓取

准确率：97.5%(普通通用接口，对 40 件随机圣遗物识别，统计完全正确的数量为 39)

准确率：100%(4k 屏幕，普通通用接口，对 110 件圣遗物识别，统计完全正确的数量为 110)
不排除还有小错误的情况，如果发现有错误请提交 issue 反馈！

使用教程

打包好的exe文件在右侧release获取

1.修改 config.ini

配置文件说明

[api]

access_token:百度 ocr access_token

Q:如何获取 access_token?
A:~~网上有很多方法,百度官方的在:百度官方教程~~
自 v1.1.0 版本开始 release 中附带获取 access_token 的程序，源码在 GetToken 文件夹

accurate_url/general_url:api 地址，一般不用更改
use：使用高精度还是普通接口(accurate_url/general_url)

[grasp_setting]

window_title:要抓取的窗口名，主要方便 PS 端/手机模拟器使用
left,top,right,bottom:面板在窗口中的位置(按照比例出现,如 left=0.67 表示 left 线段占总窗口的 67%)(典型的 16:9 分辨率使用预置选项即可)

2. 打开原神，进入背包圣遗物界面

3. 在原神中按`Alt`+`Enter`进入窗口模式

窗口模式说明

原神默认是以独占全屏的形式出现的，要置顶本窗口必须使其窗口化。
要返回独占全屏同样是按Alt+Enter

4. 运行程序(此时可以隐藏原神窗口)

5. 点击抓取按钮抓取当前显示的圣遗物，点击保存按钮保存

输出

以 json 格式保存到剪贴板
以 excel 形式保存到当前目录的 out.xls

示例图片

进入窗口模式：

抓取：

输出表格：

LOG

重构、整理代码(2021/2/17)
常见不合理错误纠正(2021/2/18)
去除部分依赖以减小打包体积(已替换 pandas 依赖为 xlrd 和 xlutils，打包体积减半为 38MB)(2021/2/18)
将配置项分离为文件
重构、整理代码
优化抓取速度和反馈(doing)
其他界面抓取
武器等抓取

常见问题

抓取到启动器怎么回事？
抓取窗口是判断窗口标题为原神实现的，推荐不使用启动器启动，如果确实抓出来了把抓出的启动器窗口关闭即可。关闭后应该不会再次抓取。
有封号风险吗？
抓取的原理是对窗口截图识别，没有对原神本身进行任何修改和干扰，理论上不会产生风险。~~这都要封号我就不玩了~~
为什么半自动？不能全自动？
先把半自动做好。
关于百度文字识别？
可以在通用普通接口的情况下取得除等级外很好的效果，也可以使用高精度接口（每日 500 次免费）获得更好的效果。
显示效果相关问题？
作者优先在 4k 环境下开发，但是只要游戏界面比例是典型的 16:9 都可以正常抓取，只是显示效果可能有细微的差距。

致谢

原神圣遗物记录脚本

Releases(v1.1.4)

v1.1.4(Feb 21, 2021)

修复”平息鸣雷的尊者“识别问题将于下个版本分离出文字配置
Source code(tar.gz)
Source code(zip)
release.zip(41.93 MB)
v1.1.3(Feb 21, 2021)

完善json导出方式，为增量式导出，更改json格式以对接圣遗物hub
Source code(tar.gz)
Source code(zip)
release.zip(41.93 MB)
v1.1.2(Feb 20, 2021)

1.修复了存在代理情况下请求api失败的问题 2.使用upx以小幅度减小打包程序体积
Source code(tar.gz)
Source code(zip)
release.zip(41.92 MB)
v1.1.1(Feb 19, 2021)

避免出现识别空白的情况加入了获取access_token的程序
Source code(tar.gz)
Source code(zip)
release.zip(45.22 MB)
v1.1.0(Feb 19, 2021)

分理出窗口抓取设置
Source code(tar.gz)
Source code(zip)
release.zip(37.68 MB)
v1.0.1(Feb 18, 2021)

加入异常处理机制，防止异常退出
Source code(tar.gz)
Source code(zip)
release.zip(37.68 MB)
v1.0.0(Feb 18, 2021)

主体功能已经完成，识别率达到了较好水平。
Source code(tar.gz)
Source code(zip)
release.zip(37.68 MB)

原神爬虫 抓取原神界面圣遗物信息

Related tags

Overview

原神圣遗物半自动爬虫

说明

使用教程

1.修改 config.ini

[api]

[grasp_setting]

2. 打开原神，进入背包圣遗物界面

3. 在原神中按Alt+Enter进入窗口模式

4. 运行程序(此时可以隐藏原神窗口)

5. 点击抓取按钮抓取当前显示的圣遗物，点击保存按钮保存

输出

示例图片

LOG

常见问题

致谢

You might also like...

Releases(v1.1.4)

v1.1.4(Feb 21, 2021)

v1.1.3(Feb 21, 2021)

v1.1.2(Feb 20, 2021)

v1.1.1(Feb 19, 2021)

v1.1.0(Feb 19, 2021)

v1.0.1(Feb 18, 2021)

v1.0.0(Feb 18, 2021)

Owner

hwa

An experiment to deploy a serverless infrastructure for a scrapy project.

Pseudo API for Google Trends

Extract embedded metadata from HTML markup

Automated data scraper for Thailand COVID-19 data

Using Selenium with Python to Web Scrap Popular Youtube Tech Channels.

Scrapes all articles and their headlines from theonion.com

Open Crawl Vietnamese Text

Find papers by keywords and venues. Then download it automatically

京东抢茅台，秒杀成功很多次讨论，天猫抢购，赚钱交流等。

爬取各大SRC当日公告 | 通过微信通知的小工具 | 赏金工具

A social networking service scraper in Python

Web scrapping

An utility library to scrape data from TikTok, Instagram, Twitch, Youtube, Twitter or Reddit in one line!

Library to scrape and clean web pages to create massive datasets.

A spider for Universal Online Judge(UOJ) system, converting problem pages to PDFs.

feapder 是一款简单、快速、轻量级的爬虫框架。以开发快速、抓取快速、使用简单、功能强大为宗旨。支持分布式爬虫、批次爬虫、多模板爬虫，以及完善的爬虫报警机制。

Lovely Scrapper

A Python package that scrapes Google News article data while remaining undetected by Google.

A high-level distributed crawling framework.

Scrapy-based cyber security news finder

原神爬虫抓取原神界面圣遗物信息

3. 在原神中按`Alt`+`Enter`进入窗口模式