[开源自开发]基于AI的公式OCR识别、分析和管理软件

[复制链接]
140 |10
发表于 2025-10-31 09:59:18 | 显示全部楼层 |阅读模式
基于AI的公式识别分析管理软件

开源地址:https://github.com/Ryson-32/AI-Formula-Scanner
一款通过AI进行公式识别、分析与管理工具。一键转为可编辑的 LaTeX,并分析变量含义与核查潜在错误。
解决痛点:解决“公式图片难以快速准确转 LaTeX”“识别后缺少校验与整理”“公式中不认识的变量需要繁琐查询”的问题。
主要技术:Tauri + Rust(截图、系统集成)/ SvelteKit + TypeScript(前端)。
核心功能:三阶段公式识别:LaTeX 提取 → 智能分析(标题/摘要/变量/术语/建议)→ 核查与置信度。
适用场景:科研写作与论文公式录入、教材与讲义排版、课堂/会议拍照后快速转录、学习笔记整理、技术博客与知识库维护。
使用流程

1) 初次打开应用 → 进入“设置”页
    填写 API Key,点击“测试”确保连通。若提示词被清空或修改过,可一键“恢复默认提示词”。可按需调整:语言(中/英)、截图快捷键、公式渲染引擎(MathJax/KaTeX)与默认 LaTeX 包裹格式。
2) 开始识别
    截图识别:点击“截图识别”或使用快捷键 Ctrl + Shift + A 拉框,松开即可开始处理。导入图片:点击“导入图片”,选择待识别的 PNG/JPG/JPEG 文件。
3) 查看与编辑
    进度指示:依次显示 LaTeX → 分析 → 核查(可对任一阶段“重试”)。基础页:预览公式、复制或编辑 LaTeX、展开原图对照。分析页:查看摘要、变量(含符号/单位)、术语、建议,以及核查报告与置信度。
4) 历史与收藏
    识别结果会自动入库。在“历史记录/收藏夹”中可搜索、排序、查看详情(抽屉式),支持收藏与删除。
一次识别调用三次LLM:

    第1次(LaTeX 提取):仅从图片提取 LaTeX 文本。第2次(智能分析):与第一次并发。基于图片生成标题、简介、变量表、术语表与建议。第3次(核查与置信度):在第一次调用返回LaTeX后开始。对比“提取到的 LaTeX + 原图”,产出状态(ok/warning/error)、问题列表、覆盖率与 0–100 的置信度。
建议的模型选择与耗时:

    Gemini-2.5-flash:综合准确率与速度较优。常见公式约 10s 左右,复杂场景约 20s。
    Gemini-2.5-flash-lite:用于轻量场景,在复杂公式上准确性略差。
    Gemini-2.5-pro:准确率接近100%,但复杂公式速度很慢。
下载地址(Windows安装包,Linux和Mac请自己下载源码编译):

    Github下载:https://github.com/Ryson-32/AI-Formula-Scanner/releases

欢迎各位大佬试用反馈!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

发表于 2025-10-31 09:59:52 | 显示全部楼层
没点文化都不敢下载

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

发表于 2025-10-31 10:00:09 | 显示全部楼层
交个朋友,我欣赏你
回复

使用道具 举报

发表于 2025-10-31 10:01:05 | 显示全部楼层
能识别公式的OCR第一次见
回复

使用道具 举报

发表于 2025-10-31 10:01:45 | 显示全部楼层
没有打包下载吗

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

发表于 2025-10-31 10:02:22 | 显示全部楼层
感觉挺厉害
回复

使用道具 举报

发表于 2025-10-31 10:03:00 | 显示全部楼层
GitHub直接能下哈,就几兆
回复

使用道具 举报

发表于 2025-10-31 10:03:49 | 显示全部楼层
虽然用不上,但还是要支持
回复

使用道具 举报

发表于 2025-10-31 10:04:26 | 显示全部楼层
暂时用不上,标记一下
回复

使用道具 举报

发表于 2025-10-31 10:05:19 | 显示全部楼层
好东西,标记一下
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表