Projeto acadêmico desenvolvido para o curso "Introdução à Ciência da Computação com Python" do Prof. Fabio Kon (IME-USP) na plataforma Coursera.
Este projeto implementa um sistema de detecção de similaridade entre textos baseado em assinaturas linguísticas, aplicando conceitos de processamento de linguagem natural e análise estatística.
- 🚀 Desenvolver algoritmos de análise textual
- ✍️ Praticar manipulação e processamento de strings
- 📊 Implementar métricas estatísticas para comparação
- 🔎 Criar sistemas de detecção de padrões
- 🧠 Aplicar conceitos de linguística computacional
✔️ Processamento de texto e strings
✔️ Cálculo de métricas estatísticas
✔️ Desenvolvimento de heurísticas personalizadas
✔️ Normalização e pré-processamento de dados
✔️ Análise comparativa entre conjuntos de dados
✔️ Implementação de algoritmos de similaridade
- ✨ Tamanho médio de palavras – caracteres por palavra
- 📝 Relação Type-Token – diversidade vocabular
- 📐 Comprimento médio de sentenças – palavras por frase
- 🧩 Complexidade sintática – frases por parágrafo
- 🔑 Frequência de palavras específicas – uso de termos-chave
- 🐍 Python 3.x
- 🔤 Processamento de Linguagem Natural (básico)
- 📈 Estatística textual aplicada
- 🧮 Técnicas de comparação de padrões
- 🔗 Algoritmos de similaridade
Seguindo o espírito de aprendizado do curso e orientação dos professores, a solução completa não é disponibilizada publicamente para preservar a integridade do processo educacional e evitar que outros alunos copiem a solução.
Assim como no Jogo do NIM, este projeto representa a importância de dominar fundamentos antes de avançar para conceitos complexos.
📖 A análise linguística é uma aplicação poderosa dos conceitos básicos de programação!
👨💻 Desenvolvido para fins acadêmicos | Coursera - IME/USP
