Keri sisuni

MULD2 Mullakaardi Parserid

Mis see on?

MULD2 projekt (Mullastiku 2. ülevaatuskaart) hõlmab Eesti riikliku mullakaardi uuendamist ja kvaliteedikontrolli. Algne analoogkaart kodeerib mullaomadused kompaktsete tähtnumbriliste sõnedena kolmes väljas:

Väli Nimetus Kirjeldus
Siffer Šiffer Mullaliigi kood(id) kaardistusüksuse (polügooni) kohta
Loimis Loimis Mulla lõimis (lõimisekihid) kuni 4 sügavuskihis
Huumus Huumus Orgaaniline horisont — tüüp, lagunemisaste ja paksus

Need väljad on autorite poolt aastakümnete jooksul analoogkaardi digitaliseerimisel kirja pandud. Need sisaldavad mitmesuguseid kodeerimistavasid, eraldajaid ja andmesisestuse artefakte, mis tuleb enne andmete kasutamist kvantitatiivses analüüsis või andmebaasipäringutes lahendada.

See teek pakub automatiseeritud parsereid, mis konverteerivad iga toorvälja puhasteks, tüübitud andmebaasitulpadeks.


Kolm parserit lühidalt

Parser Sisendi näide Peamised väljundid
Siffer Ko;D;LPe siffer_1..4, n_siffers, parse_ok_s
Loimis l40-70/ls₂30/+ls₂ EST_TXT1..4, CLAY/SILT/SAND/ROCK 1..4, Z1..4, parse_ok_l
Huumus th15/h5 t₂20 h_type_1..4, h_depth_min/max_1..4, parse_ok_h

Kuidas töövoog toimib

Iga parser järgib kahefaasilist lähenemist:

  1. Parandamine (Repair) — otsingupõhine eeltöötlus parandab teadaolevad digitaliseerimise artefaktid (trükivead, valed eraldajad, vanad tähistused) enne gramatika rakendamist.

  2. Parsimine (Parse) — ametlik grammatika (Arpeggio PEG parser Siffri ja Loimise jaoks; regulaaravaldise klassifikaator Huumuse jaoks) valideerib parandatud sõne ja eraldab struktureeritud väljad.

Tulemused kirjutatakse tagasi PostgreSQL-i output_review tabelisse ja kuvatakse selle veebirakenduse kaudu.


Parserite testimine

Saate testida mis tahes koodisõne otse brauseris:

Punkt Tee Kirjeldus
Swagger UI /api/docs Interaktiivne API uurija
Siffer parser /parse/siffer POST {"code": "Ko;LP"}
Loimis parser /parse/loimis POST {"code": "l40/ls₂"}
Huumus parser /parse/huumus POST {"code": "th15/h5"}

Või kasutage Muldade dekodeerija paneeli kaardivaates.


Kuhu edasi