English: tool to convert XML/GML files with addresses provided by Polish government.
Narzędzie do konwersji plików XML/GML z adresami z Państwowego Rejestru Granic (paczka zbiorcza).
- ✅ Parsowanie XML modelu 2012
- ✅ Parsowanie XML modelu 2021
- do wersji 0.5.0 koordynaty są czytane w odwróconej kolejności, od wersji 0.6.0 jest poprawnie
- do wersji 0.6.0 nazwy miejscowości mogą być niepoprawnie czytane, od wersji 0.6.1 jest poprawnie
- ✅ Zapis do CSV
- ✅ Zapis do GeoParquet
- ✅ Odczyt bezpośrednio z pliku ZIP
- Pasek stanu postępu
- Optymalizacja ustawień formatu parquet (encodings, bloom filters, etc)
- Wielowątkowość
- Python bindings
- ✅ Opcja zapisu GeoParquet w EPSG:4326
- Zapis do FlatGeoBuf
- Zapis do GeoJSON
- Pobieranie pliku ZIP z adresami z Geoportalu
- Pobieranie pliku ZIP ze słownikami TERYT z API GUS
Pobierz plik zip (Windows) lub tar.gz (Linuks) z zakładki Releases i rozpakuj go.
Uruchom plik w terminalu/wierszu poleceń wraz z odpowiednimi flagami wskazującymi lokalizację plików wejściowych i wyjściowych. Możesz użyć flagi --help żeby zobaczyć dostępne opcje.
Przykład:
%HOMEPATH%\Downloads\prg_convert.exe --help./prg_convert.exe --schema-version 2012 --input-paths ./*.xml --output-format csv --output-path ./adresy.csvFlaga --schema-version określa czy plik jest w poprzednim formacie (wtedy wartość: 2012) czy w nowym (wtedy wartość: 2021). Paczka zbiorcza zip zawiera pliki w obu formatach. Obecnie (listopad 2025) stare pliki mają rozszerzenie: .xml, a nowe: .gml i prefix w nazwie: NOWE_.
Jeżeli jako plik wejściowy podasz ścieżkę do paczki ZIP to flag --schema-version będzie determinować, które pliki będą czytane (2012: te z rozszerzeniem .xml, 2021: te z rozszerzeniem .gml).
Uwaga: Dla --schema-version 2021 trzeba podać także parametr --teryt-path ze ścieżką do pliku xml (od wersji 0.6.2 można podac ścieżkę po prostu do pobranego pliku zip, nie trzeba go rozpakowywać) pobranego ze strony eTERYT GUSu (TERC, podstawowa). W nowym modelu PRG nie ma informacji o nazwach jednostek administracyjnych dlatego potrzebny jest ten dodatkowy plik żeby je dodać.