Este projeto inovador mergulha no universo dos reviews de livros mais vendidos na Amazon para extrair insights valiosos sobre a percepção dos leitores. Através de uma abordagem de análise de sentimentos e visualizações interativas, buscamos desvendar as opiniões e emoções expressas pelos consumidores, fornecendo uma compreensão aprofundada do que torna um livro popular e bem-recebido na maior plataforma de e-commerce de livros do mundo.
O principal objetivo deste projeto é desenvolver uma aplicação web interativa que permita aos usuários explorar e compreender a análise de sentimentos dos reviews de livros da Amazon. Para isso, o aplicativo:
- Coleta e Processa Dados: Adquire e prepara dados de reviews de livros mais vendidos na Amazon a partir de um dataset robusto disponível no Kaggle.
- Realiza Análise de Sentimentos: Aplica técnicas avançadas de Processamento de Linguagem Natural (NLP) para analisar a polaridade (positiva, negativa, neutra) e a intensidade dos sentimentos expressos em cada review.
- Apresenta Visualizações Interativas: Exibe os resultados da análise de forma clara e envolvente através de gráficos dinâmicos, nuvens de palavras e dashboards intuitivos, permitindo que os usuários explorem os dados de diferentes perspectivas.
Este projeto é construído sobre uma pilha de tecnologias modernas e eficientes, garantindo robustez, escalabilidade e uma experiência de usuário fluida:
- Python: A linguagem de programação principal, utilizada para a lógica de backend, processamento de dados e análise de sentimentos.
- Streamlit: Um framework poderoso para a criação rápida e fácil de aplicações web interativas e dashboards de dados, permitindo a visualização dos insights em tempo real.
- Pandas: Essencial para a manipulação e análise eficiente de grandes volumes de dados tabulares, desde a limpeza até a transformação dos reviews.
- NLTK (Natural Language Toolkit) ou TextBlob: Bibliotecas fundamentais para o Processamento de Linguagem Natural (NLP), utilizadas para tokenização, lematização, remoção de stopwords e outras operações textuais.
- VADER (Valence Aware Dictionary and sEntiment Reasoner) ou outros modelos de análise de sentimentos: Ferramentas especializadas para determinar a polaridade e a intensidade dos sentimentos expressos no texto dos reviews.
- Plotly: Uma biblioteca de visualização de dados de ponta, utilizada para criar gráficos interativos e dinâmicos que permitem aos usuários explorar os dados com facilidade.
O coração deste projeto reside em um dataset abrangente, cuidadosamente selecionado do Kaggle, que contém informações cruciais sobre os livros mais vendidos na Amazon. Este dataset inclui:
- Título do Livro: O nome completo da obra.
- Autor: O(s) autor(es) do livro.
- Gênero: A categoria literária à qual o livro pertence.
- Reviews dos Usuários: O texto integral dos comentários e avaliações deixados pelos leitores, que são a base para a nossa análise de sentimentos.
O fluxo de trabalho deste projeto segue uma metodologia clara e estruturada para garantir a precisão e a relevância dos insights:
- Coleta e Carregamento de Dados:
- O dataset é carregado de forma eficiente em um DataFrame Pandas, servindo como a base para todas as análises subsequentes.
- Pré-processamento de Texto:
- Os reviews são limpos e normalizados, removendo caracteres especiais, pontuações, números e convertendo o texto para minúsculas. Stopwords são removidas e a lematização é aplicada para padronizar as palavras.
- Análise de Sentimentos:
- Modelos de análise de sentimentos (como VADER) são aplicados a cada review para classificar sua polaridade (positiva, negativa, neutra) e atribuir uma pontuação de sentimento.
- Visualização e Exploração:
- Gráficos e dashboards interativos são criados utilizando Plotly para visualizar os resultados da análise. Exemplos de visualizações incluem:
- Distribuição de Sentimentos: Gráficos de barras ou pizza mostrando a proporção de reviews positivos, negativos e neutros.
- Nuvens de Palavras: Visualizações que destacam as palavras mais frequentes em reviews positivos e negativos, revelando termos-chave associados a diferentes sentimentos.
- Distribuição de Reviews por Categoria/Gênero: Gráficos que mostram como os sentimentos variam entre diferentes gêneros literários.
- Gráficos de Linha de Evolução de Sentimentos: Se dados temporais estiverem disponíveis, gráficos que mostram a evolução dos sentimentos ao longo do tempo.
- Gráficos e dashboards interativos são criados utilizando Plotly para visualizar os resultados da análise. Exemplos de visualizações incluem:
Para configurar e executar este projeto em sua máquina local, siga os passos abaixo:
- Clone o Repositório:
git clone https://github.com/seu-usuario/nome-do-repositorio.git cd nome-do-repositorio - Crie e Ative um Ambiente Virtual (Recomendado):
python -m venv venv source venv/bin/activate # No Windows: .\venv\Scripts\activate
- Instale as Dependências:
*(Certifique-se de criar um arquivo
pip install -r requirements.txt
requirements.txtcom todas as bibliotecas listadas na seção

