Skip to content

Conversation

@nitaibezerra
Copy link
Contributor

Summary

  • Divide os 4 módulos densos (~6.600 linhas) em 12 arquivos focados (~400-900 linhas cada)
  • Adiciona caminhos "Básico" vs "Completo" no roteiro de onboarding
  • Cria nova pasta docs/onboarding/ds/ com estrutura modular

Nova Estrutura

docs/onboarding/ds/
├── explorando-dataset/
│   ├── index.md          (Básico - carregamento, EDA)
│   ├── analise-tematica.md (Intermediário - temas, temporal)
│   └── analise-texto.md    (Intermediário - estatísticas, wordcloud)
├── nlp-pipeline/
│   ├── index.md          (Fundamentos - tokenização, TF-IDF)
│   ├── embeddings.md       (Intermediário - BERTimbau, E5)
│   └── busca-semantica.md  (Avançado - FAISS, Typesense)
├── ml-classificacao/
│   ├── index.md          (Introdução - preparação dados)
│   ├── modelos-classicos.md (Intermediário - SVM, RF)
│   └── deep-learning.md    (Avançado - fine-tuning BERT)
└── qualidade-dados/
    ├── index.md          (Validação - Pydantic, Pandera)
    ├── metricas.md         (Avançado - ROUGE, drift)
    └── feedback-loop.md    (Avançado - anotação, melhoria)

Benefícios

Antes Depois
4 arquivos densos (~1.400-2.300 linhas cada) 12 arquivos focados (~400-900 linhas cada)
Iniciantes precisam ler tudo Iniciantes leem só index.md
Navegação linear forçada Navegação por interesse
Intimidante para iniciantes Progressão gradual

Test plan

  • Build MkDocs sem warnings de links quebrados
  • Verificar navegação no site gerado
  • Testar links internos entre páginas

🤖 Generated with Claude Code

Divide os 4 módulos densos em 12 arquivos focados para melhor
progressão de aprendizado:

- Explorando Dataset: index + análise-temática + análise-texto
- NLP Pipeline: index + embeddings + busca-semântica
- ML Classificação: index + modelos-clássicos + deep-learning
- Qualidade de Dados: index + métricas + feedback-loop

Adiciona caminhos "Básico" vs "Completo" no roteiro de onboarding,
permitindo que iniciantes sigam apenas os index.md enquanto
usuários avançados podem aprofundar em cada subpágina.

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
@nitaibezerra nitaibezerra merged commit 37d5fb5 into main Jan 6, 2026
2 checks passed
@nitaibezerra nitaibezerra deleted the docs/ds-trail-reorganization branch January 6, 2026 14:18
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants