# Интеллектуальный reader научных статей **Цель:** собрать инструмент для обработки научных статей. Работа в этом направлении: https://arxiv.org/abs/2210.02830 **Задачи**: - обзор существующих инструментов для разбора pdf, способных работать на обычном ноутбуке - обзор существующих облачных инструментов для разбора pdf - выбор или, вероятно, написание/дописание своего инструмента - ui на tauri + ts **Что будем использовать** - ts + tauri - python/go/rust # Доп материалы ## Text embeddings - https://qdrant.github.io/fastembed/ - https://github.com/qdrant/qdrant ## Библиотеки для парсинга - https://github.com/Filimoa/open-parse/tree/main - https://github.com/jsvine/pdfplumber - https://github.com/topics/pdf-parser - https://github.com/py-pdf/pypdf - https://github.com/smalot/pdfparser - https://github.com/jstockwin/py-pdf-parser - https://github.com/RDFLib/rdflib - https://pypi.org/project/camelot-py/ - https://pypi.org/project/tabula-py/ - apach-tika **AI парсилки** Здесь пример zero-shot pdf extraction на основе gpt-mini: https://github.com/getomni-ai/zerox?tab=readme-ov-file внутри есть ссылки на другие платные альтернативы: - https://aws.amazon.com/textract/pricing/#:~:text=Amazon%20Textract%20API%20pricing - https://cloud.google.com/document-ai/pricing - https://azure.microsoft.com/en-us/pricing/details/ai-document-intelligence/ - https://unstructured.io/api-key-hosted#:~:text=Cost%20and%20Usage%20%0AGuidelines Здесь evaluation разных Multimodal Large Language Models: https://github.com/BradyFU/Awesome-Multimodal-Large-Language-Models/tree/Evaluation **На чем можно писать GUI** - https://dioxuslabs.com/ - https://tauri.app - flutter??? - какой-то ultra fast tauri + angular setup https://github.com/maximegris/angular-tauri