desktop

VideoChat LLM z ASCII VNC - Dokumentacja

📑 Spis treści

Wprowadzenie
Funkcje
Architektura
Instalacja i zależności systemowe
Testowanie i walidacja
Struktura projektu i dokumentacja
Najczęstsze problemy
Kontakt i wsparcie
Prezentacja rozwiązania
Szczegółowa dokumentacja
Konfiguracja RTSP Video

Wprowadzenie

VideoChat LLM to aplikacja desktopowa oparta na Electron, która umożliwia prowadzenie rozmów głosowych z asystentem AI, wizualizowanym za pomocą animacji ASCII. Aplikacja łączy technologie przetwarzania języka naturalnego (LLM), rozpoznawania mowy (STT) i syntezy mowy (TTS) w jednym pakiecie, wraz z infrastrukturą Kubernetes (K3s), Terraform i Ansible do zarządzania swoimi komponentami.

Funkcje

Interakcja głosowa - rozpoznawanie i synteza mowy do naturalnej konwersacji
Animacja ASCII - wizualizacja asystenta poprzez animacje ASCII w różnych stanach
Lokalny model językowy - prosty LLM do przetwarzania zapytań
Infrastruktura mikrousługowa - opcjonalne użycie Kubernetes (K3s) do zarządzania komponentami
Historia rozmów - zapis przebiegu konwersacji
Konfigurowalność - panel ustawień do dostosowania działania aplikacji

Architektura

Aplikacja składa się z następujących komponentów:

Frontend - interfejs użytkownika napisany w React, wyświetlający wideo z kamery i animację ASCII
Backend - serwisy obsługujące LLM, STT i TTS
NoVNC - serwer do generowania i wyświetlania animacji ASCII
Infrastruktura - opcjonalne Kubernetes (K3s), Terraform i Ansible

Diagram przepływu danych:

+----------+    Audio    +------------+    Text    +------------+
|          |----------->|             |---------->|             |
|  Kamera  |            |     STT     |           |     LLM     |
|  i Mic   |    Video   |             |           |             |
|          |-----+      +------------+           +------------+
+----------+     |                                     |
                 |                                     |
                 v                                     v
           +----------+                         +------------+
           |          |                         |             |
           |  React   |<------------------------|     TTS     |
           |   UI     |        Audio            |             |
           |          |                         +------------+
           +----------+                                |
                 |                                     |
                 |      ASCII Animation                |
                 v                                     v
           +----------+                         +------------+
           |          |                         |             |
           |  NoVNC   |<------------------------|  Asciifier  |
           |  Server  |                         |             |
           |          |                         +------------+
           +----------+

Instalacja i zależności systemowe

Zalecane zależności systemowe (dla natywnych modułów Node.js):
- Debian/Ubuntu: sudo apt-get install -y build-essential libcairo2-dev libpango1.0-dev libjpeg-dev libgif-dev librsvg2-dev
- Fedora/RHEL: sudo dnf install -y gcc-c++ cairo-devel pango-devel libjpeg-turbo-devel giflib-devel librsvg2-devel
- Arch Linux: sudo pacman -Sy --noconfirm base-devel cairo pango libjpeg-turbo giflib librsvg
- Jeśli nie możesz zainstalować automatycznie, sprawdź komunikaty w install.sh.
Instalacja projektu:
```
./install.sh
```
Skrypt automatycznie sprawdzi i zainstaluje zależności systemowe oraz npm.
Uruchomienie aplikacji:
```
./bin/start-app
```
Skrypt uruchomi aplikację Electron z lokalnej instalacji.
Naprawa problemów:
- Jeśli pojawią się błędy z uprawnieniami, uruchom sudo ./install.sh.
- Sprawdź logi w ~/.npm/_logs/ przy problemach z npm.

Testowanie i walidacja

Testy jednostkowe i E2E:
```
bash test.sh
```
Skrypt uruchamia testy jednostkowe (Jest), E2E (jeśli dostępne), waliduje pliki YAML i JSON.
Walidacja konfiguracji:
```
npm run validate
```
Sprawdza poprawność plików konfiguracyjnych.

Struktura projektu i dokumentacja

Projekt jest zorganizowany w następujący sposób:

/
├── bin/                  # Skrypty pomocnicze
├── dist/                 # Skompilowana aplikacja (generowana przez webpack)
├── docs/                 # Dokumentacja
├── models/               # Modele AI (LLM, STT, TTS)
├── src/                  # Kod źródłowy
│   ├── infrastructure/   # Zarządzanie infrastrukturą (K3s, Terraform, Ansible)
│   ├── renderer/         # Kod interfejsu użytkownika
│   │   ├── modules/      # Moduły JavaScript (zrefaktoryzowany kod)
│   │   │   ├── app.js            # Główny plik aplikacji
│   │   │   ├── htmlStructure.js  # Struktura HTML
│   │   │   ├── socketHandlers.js # Obsługa komunikacji przez socket.io
│   │   │   ├── speechRecognition.js # Rozpoznawanie mowy
│   │   │   ├── speechSynthesis.js # Synteza mowy
│   │   │   └── uiComponents.js   # Komponenty interfejsu użytkownika
│   │   ├── components/    # Komponenty React
│   │   ├── bundle.js      # Skompilowany kod (przestarzały, do usunięcia)
│   │   ├── index.html     # Główny plik HTML
│   │   └── styles.css     # Style CSS
│   └── services/         # Serwisy (LLM, STT, TTS, ASCII)
└── tests/                # Testy

System budowania

Projekt używa następujących narzędzi do budowania:

Webpack - do budowania frontendu
Babel - do transpilacji kodu JavaScript
Electron Builder - do pakowania aplikacji desktopowej

Skrypty npm

npm start - uruchamia aplikację w trybie deweloperskim
npm run build - buduje całą aplikację (frontend i aplikację desktopową)
npm run build:webpack - buduje tylko frontend
npm run build:electron - buduje tylko aplikację desktopową
npm run webpack:dev - buduje frontend w trybie deweloperskim
npm run webpack:watch - buduje frontend w trybie deweloperskim z automatycznym odświeżaniem
npm run dev - uruchamia serwer deweloperski dla frontendu
npm run clean - usuwa katalog dist
Szczegółowa dokumentacja znajduje się w katalogu ./docs/
Struktura katalogów i kluczowe pliki opisane są w docs/2.md

Najczęstsze problemy

Problemy z natywnymi modułami: Upewnij się, że masz zainstalowane zależności systemowe (patrz wyżej).
Problemy z Electron: Jeśli pojawi się komunikat o błędnej instalacji Electron, usuń node_modules i uruchom ponownie install.sh.
Problemy z npm: Sprawdź logi w ~/.npm/_logs/.

Kontakt i wsparcie

Dokumentacja techniczna: katalog docs/
Skrypt instalacyjny: install.sh
Skrypt testowy: test.sh

Aplikacja VideoChat LLM z ASCII VNC to nowoczesny, samodzielny desktopowy asystent AI z pełną dokumentacją i automatyzacją instalacji oraz testów.

Uruchomienie

Aplikacja uruchamia się w trybie Electron, tworząc okno desktopowe z interfejsem użytkownika. Po uruchomieniu:

Pojawia się interfejs podzielony na dwa panele - lewy z obrazem z kamery użytkownika, prawy z animacją ASCII asystenta
Asystent automatycznie wita użytkownika (wiadomość tekstowa i głosowa)
Użytkownik może rozpocząć rozmowę naciskając przycisk mikrofonu
Podczas mówienia przez użytkownika, animacja asystenta zmienia się w tryb "słuchania"
Po zakończeniu wypowiedzi, następuje przetwarzanie i animacja przechodzi w tryb "myślenia"
Asystent odpowiada (tekst i głos), z animacją w trybie "mówienia"
Cykl może być kontynuowany

Infrastruktura

Aplikacja może opcjonalnie korzystać z Kubernetes (K3s) do zarządzania swoimi komponentami:

W konfiguracji można włączyć/wyłączyć K3s
Terraform zarządza lokalną konfiguracją infrastruktury
Ansible wykonuje playbooki konfiguracyjne

Dostosowanie

Animacje ASCII

Animacje ASCII są przechowywane w plikach tekstowych w katalogu src/ascii-animations/. Każda animacja składa się z klatek oddzielonych znacznikiem FRAME. Dostępne animacje:

idle.txt - stan spoczynku
talking.txt - podczas mówienia
listening.txt - podczas słuchania
thinking.txt - podczas przetwarzania

Możesz dostosować te pliki, tworząc własne animacje ASCII.

Ustawienia

Panel ustawień pozwala na konfigurację:

Urządzeń audio (mikrofon, głośniki)
Modeli AI (LLM, TTS)
Infrastruktury (K3s, Terraform)

Konfiguracja RTSP Video

Aplikacja umożliwia dodanie własnego źródła obrazu wideo poprzez protokół RTSP (np. kamera IP, rejestrator, streaming). Konfigurację można wykonać na dwa sposoby:

Przez rozmowę w czacie VideoChat – wystarczy napisać np. "Chcę dodać kamerę RTSP" lub podać adres streamu. Asystent poprosi kolejno o adres RTSP, login i hasło (jeśli wymagane), a następnie zapisze konfigurację.
Przez zakładkę Ustawienia – w sekcji "Ustawienia RTSP Video" można wpisać adres, login i hasło do streamu oraz zapisać konfigurację ręcznie.

Konfiguracja jest wykorzystywana do opisu obrazu wideo oraz dalszej integracji z asystentem.

Budowanie pakietów

Aby zbudować pakiety instalacyjne:

./build.sh

Tworzy to pakiety dla systemu Linux w formatach:

AppImage
DEB
RPM

Wymagania systemowe

Linux (Ubuntu, Debian, Fedora, itp.)
Node.js 16+
npm 8+

Rozwiązywanie problemów

Problemy z audio

Upewnij się, że mikrofon jest poprawnie skonfigurowany
Sprawdź uprawnienia przeglądarki do dostępu do mikrofonu
Zresetuj urządzenia audio w panelu ustawień

Problemy z K3s

Sprawdź, czy K3s jest poprawnie zainstalowany
Upewnij się, że kubeconfig jest poprawnie skonfigurowany
Sprawdź logi aplikacji

Problemy z animacją ASCII

Sprawdź, czy serwer noVNC działa na porcie 6080
Sprawdź logi serwera w konsoli aplikacji
Upewnij się, że pliki animacji istnieją i są poprawnie sformatowane

Licencja

Ten projekt jest udostępniany na licencji LICENSE.

Name		Name	Last commit message	Last commit date
Latest commit History 26 Commits
ansible		ansible
bin		bin
docs		docs
examples/test-scenarios		examples/test-scenarios
kubernetes		kubernetes
models		models
src		src
terraform		terraform
tests/renderer/modules		tests/renderer/modules
vendor		vendor
.gitignore		.gitignore
.jsonlintrc		.jsonlintrc
.yamllint.yml		.yamllint.yml
README.md		README.md
babel.config.json		babel.config.json
build.js		build.js
build.sh		build.sh
config.json		config.json
install.sh		install.sh
jest.config.js		jest.config.js
jest.setup.js		jest.setup.js
package.json		package.json
run-tests.js		run-tests.js
src.md		src.md
test-speech.html		test-speech.html
test.sh		test.sh
webpack.config.js		webpack.config.js

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

desktop

VideoChat LLM z ASCII VNC - Dokumentacja

📑 Spis treści

Wprowadzenie

Funkcje

Architektura

Diagram przepływu danych:

Instalacja i zależności systemowe

Testowanie i walidacja

Struktura projektu i dokumentacja

System budowania

Skrypty npm

Najczęstsze problemy

Kontakt i wsparcie

Uruchomienie

Infrastruktura

Dostosowanie

Animacje ASCII

Ustawienia

Konfiguracja RTSP Video

Budowanie pakietów

Wymagania systemowe

Rozwiązywanie problemów

Problemy z audio

Problemy z K3s

Problemy z animacją ASCII

Licencja

About

Uh oh!

Releases

Packages

Uh oh!

Languages

coboarding/desktop

Folders and files

Latest commit

History

Repository files navigation

desktop

VideoChat LLM z ASCII VNC - Dokumentacja

📑 Spis treści

Wprowadzenie

Funkcje

Architektura

Diagram przepływu danych:

Instalacja i zależności systemowe

Testowanie i walidacja

Struktura projektu i dokumentacja

System budowania

Skrypty npm

Najczęstsze problemy

Kontakt i wsparcie

Uruchomienie

Infrastruktura

Dostosowanie

Animacje ASCII

Ustawienia

Konfiguracja RTSP Video

Budowanie pakietów

Wymagania systemowe

Rozwiązywanie problemów

Problemy z audio

Problemy z K3s

Problemy z animacją ASCII

Licencja

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages