MULD2 Mullakaardi Parserid¶
Mis see on?¶
MULD2 projekt (Mullastiku 2. ülevaatuskaart) hõlmab Eesti riikliku mullakaardi uuendamist ja kvaliteedikontrolli. Algne analoogkaart kodeerib mullaomadused kompaktsete tähtnumbriliste sõnedena kolmes väljas:
| Väli | Nimetus | Kirjeldus |
|---|---|---|
| Siffer | Šiffer | Mullaliigi kood(id) kaardistusüksuse (polügooni) kohta |
| Loimis | Loimis | Mulla lõimis (lõimisekihid) kuni 4 sügavuskihis |
| Huumus | Huumus | Orgaaniline horisont — tüüp, lagunemisaste ja paksus |
Need väljad on autorite poolt aastakümnete jooksul analoogkaardi digitaliseerimisel kirja pandud. Need sisaldavad mitmesuguseid kodeerimistavasid, eraldajaid ja andmesisestuse artefakte, mis tuleb enne andmete kasutamist kvantitatiivses analüüsis või andmebaasipäringutes lahendada.
See teek pakub automatiseeritud parsereid, mis konverteerivad iga toorvälja puhasteks, tüübitud andmebaasitulpadeks.
Kolm parserit lühidalt¶
| Parser | Sisendi näide | Peamised väljundid |
|---|---|---|
| Siffer | Ko;D;LPe |
siffer_1..4, n_siffers, parse_ok_s |
| Loimis | l40-70/ls₂30/+ls₂ |
EST_TXT1..4, CLAY/SILT/SAND/ROCK 1..4, Z1..4, parse_ok_l |
| Huumus | th15/h5 t₂20 |
h_type_1..4, h_depth_min/max_1..4, parse_ok_h |
Kuidas töövoog toimib¶
Iga parser järgib kahefaasilist lähenemist:
-
Parandamine (Repair) — otsingupõhine eeltöötlus parandab teadaolevad digitaliseerimise artefaktid (trükivead, valed eraldajad, vanad tähistused) enne gramatika rakendamist.
-
Parsimine (Parse) — ametlik grammatika (Arpeggio PEG parser Siffri ja Loimise jaoks; regulaaravaldise klassifikaator Huumuse jaoks) valideerib parandatud sõne ja eraldab struktureeritud väljad.
Tulemused kirjutatakse tagasi PostgreSQL-i output_review tabelisse ja kuvatakse selle veebirakenduse kaudu.
Parserite testimine¶
Saate testida mis tahes koodisõne otse brauseris:
| Punkt | Tee | Kirjeldus |
|---|---|---|
| Swagger UI | /api/docs | Interaktiivne API uurija |
| Siffer parser | /parse/siffer | POST {"code": "Ko;LP"} |
| Loimis parser | /parse/loimis | POST {"code": "l40/ls₂"} |
| Huumus parser | /parse/huumus | POST {"code": "th15/h5"} |
Või kasutage Muldade dekodeerija paneeli kaardivaates.
Kuhu edasi¶
- Siffer parser → — mullaliikide koodide selgitus
- Loimis parser → — lõimise tähistus ja kihtide sügavused
- Huumus parser → — orgaanilise horisondi klassifikatsioon
- Väljade viide → — iga väljundtulpa tähendus
- API viide → — genereeritud automaatselt Pythoni dokumentatsioonist