1.6 KiB

Raw Blame History

Цель: собрать инструмент для обработки научных статей. Работа в этом направлении: https://arxiv.org/abs/2210.02830

Задачи:

Что будем использовать

Доп материалы

Text embeddings

Библиотеки для парсинга

AI парсилки

Здесь пример zero-shot pdf extraction на основе gpt-mini: https://github.com/getomni-ai/zerox?tab=readme-ov-file внутри есть ссылки на другие платные альтернативы: - https://aws.amazon.com/textract/pricing/#:~:text=Amazon%20Textract%20API%20pricing - https://cloud.google.com/document-ai/pricing - https://azure.microsoft.com/en-us/pricing/details/ai-document-intelligence/ - https://unstructured.io/api-key-hosted#:~:text=Cost%20and%20Usage%20%0AGuidelines

Здесь evaluation разных Multimodal Large Language Models: https://github.com/BradyFU/Awesome-Multimodal-Large-Language-Models/tree/Evaluation

На чем можно писать GUI

https://dioxuslabs.com/
https://tauri.app
какой-то ultra fast tauri + angular setup https://github.com/maximegris/angular-tauri