Cry199Cry199 | Cauã Ribeiro

Desenvolvedor Full Stack

Carregando documentação...

projeto_rag | Cry199

.
├── PDFs/                     # 1. Coloque seus PDFs de entrada aqui
├── arquivos_markdown_pdfs/   # 2. Saída intermediária dos Markdowns brutos (ignorado pelo Git)
├── markdown_final_limpo_ia/  # 3. Saída dos Markdowns limpos pela IA (ignorado pelo Git)
├── banco_de_dados_vetorial/  # 4. Banco de dados vetorial ChromaDB (ignorado pelo Git)
├── app/                      # Código-fonte da aplicação FastAPI
│   ├── endpoints/            # Módulos com os endpoints da API
│   │   ├── chat.py           # Lógica do endpoint /chat
│   │   └── health.py         # Lógica do endpoint /health
│   ├── models.py             # Modelos Pydantic para a API
│   └── main.py               # Ponto de entrada e configuração da API FastAPI
├── 1_converter_pdfs.py       # Script para converter PDFs em Markdown
├── 2.5_refinar_markdown_com_ia.py # Script para limpar o Markdown com IA
├── 2_criar_banco_vetorial.py # Script para criar o banco de dados vetorial
├── 3_perguntar_ao_rag.py     # Script para fazer perguntas via CLI
├── .env.example              # Arquivo de exemplo para variáveis de ambiente
├── .gitignore                # Arquivos e pastas a serem ignorados pelo Git
└── README.md                 # Este arquivo

Clone o repositório:

git clone [https://github.com/seu-usuario/seu-repositorio.git](https://github.com/seu-usuario/seu-repositorio.git)
cd seu-repositorio

Crie e ative um ambiente virtual:

python -m venv .venv
source .venv/bin/activate  # No Windows: .venv\Scripts\activate

Instale as dependências: (Nota: Um arquivo requirements.txt seria ideal. Com base nos scripts, as dependências são as seguintes)

pip install fastapi "uvicorn[standard]" langchain-google-genai langchain-chroma langchain python-dotenv pymupdf pytesseract pydantic google-generativeai

Configure suas variáveis de ambiente: Renomeie o arquivo .env.example para .env e adicione sua chave de API do Google.
```
# .env
GOOGLE_API_KEY="SUA_CHAVE_API_AQUI"
```

python 1_converter_pdfs.py

python 2.5_refinar_markdown_com_ia.py

python 2_criar_banco_vetorial.py

python 3_perguntar_ao_rag.py

Inicie o servidor FastAPI:
```
uvicorn app.main:app --reload
```
Acesse a documentação interativa: Abra seu navegador e vá para http://127.0.0.1:8000/docs.
Interaja com o chatbot:
- Use o endpoint POST /chat.
- Clique em "Try it out".
- Faça sua pergunta no campo question do corpo da requisição e envie. O histórico da conversa (chat_history) será preenchido e retornado automaticamente pela API.

Corpo da Requisição (QueryRequest):

{
  "question": "Qual é a principal recomendação sobre governança corporativa?",
  "chat_history": [
    {
      "question": "Olá",
      "answer": "Olá! Tudo bem? Como posso ajudar você hoje? 😊",
      "sources": []
    }
  ]
}

Resposta de Sucesso (QueryResponse):

{
  "answer": "A principal recomendação é a implementação de um conselho de administração diversificado e independente para garantir a tomada de decisões imparcial e estratégica.",
  "sources": [
    {
      "source_file": "meu_documento_de_governanca.md"
    }
  ],
  "chat_history": [
    {
      "question": "Olá",
      "answer": "Olá! Tudo bem? Como posso ajudar você hoje? 😊",
      "sources": []
    },
    {
      "question": "Qual é a principal recomendação sobre governança corporativa?",
      "answer": "A principal recomendação é a implementação de um conselho de administração diversificado e independente para garantir a tomada de decisões imparcial e estratégica.",
      "sources":

Cry199Cry199 | Cauã Ribeiro

projeto_rag

Chatbot RAG com Documentos PDF usando Gemini e LangChain

✨ Principais Funcionalidades

🚀 Fluxo de Trabalho do Projeto

🛠️ Tecnologias Utilizadas

📂 Estrutura de Pastas

⚙️ Configuração e Instalação

Pré-requisitos

Passos de Instalação

🚀 Como Usar

Passo 1: Coloque seus PDFs

Passo 2: Converta os PDFs para Markdown

Passo 3: Refine os arquivos Markdown com IA

Passo 4: Crie o Banco de Dados Vetorial

Passo 5: Converse com seus Documentos

Opção A: Usar a Interface de Linha de Comando (CLI)

Opção B: Usar a API Web

📚 Documentação da API

`GET /health`

`POST /chat`

📝 `.gitignore`