Attīstot tēmu par nosaukumu vienādošanu un palasot wiki par nosaukumu tulkošanu, nolūkā botam pielikt arī nosacījumus tagu automātiskai labošanai, ir priekšlikums tam pievienot divus nosacījumus:
1) dzēst name:* tagus, ja pilnīgi visi no tiem sakrīt ar name;
2) pievienot name:lv tagu, kas sakrīt ar name, ja ir name:* tagi, kas atšķiras no name, bet starp tiem nav name:lv.
Piemērs node tagiem, kas tiktu mainīti (ne svaigākā OSM versija, bet principu ieskatam tas nemaina): name_nodes.xlsx
Ja ir OK, tad pierakstītu ways un relations un papildinātu kodu.
Vēl arī 3) - pievienot trūkstošos name tagus no name:lv, ja tādi jau ir pievienoti. Šādi gadījumi gan ir tikai daži desmiti.
Es palasīju wiki un kaut kā es neesmu pārliecināts par 1) loģiku. A kā var zināt, kā citās valodās ir name:*
? Noņemot visus nost vairs nevar zināt, kurām valodām sakrīt un kuras vēl nav pieliktas. Ja man ir name=Leto
+ name:lv=Leto
+ name:en=Leto
; tad bots noņem tikai uz name=Leto
; bet tad kāds pieliek name:ru=Лето
; un tagad kā var zināt, kāds ir name:en
vai pat name:lv
? Kāpēc bots domāja, ka visās valodās būs tā pat "Leto" un var ņemt nost?
Latvijā name un name:lv būtu jāsakrīt, izņemot gadījumus, kad elementi atrodas vairākās valstīs. Labojamo gadījumu nav pārāk daudz, kādi pāris simti, šie gan jāskata manuāli. Ja kāds pieliks name:* , kas no name atšķiras, tad name:lv tik pielikts atpakaļ automātiski (sakritīs ar name). Par citām agrāk pieliktajām valodām taisnība, vēsturē vienīgi var redzēt. Var piekodēt klāt, ka bots paša noņemtās no vēstures pieliek atpakaļ (ņem jaunāko name:* no visām bota veiktajām izmaiņām), ja parādījušies jauni name:*, kas no name atšķiras (pieliek tās, kuru nav jaunākajā versijā). Jāatrod vai jāizveido kāds elements testam, kur šis nosacījums izpildītos. Vairumā gadījumu jau tie tulkojumi, kas visās valodās ir vienādi, izskatās sakopēti nedomājot.
Latvijā nav vietu, kur name būtu līvu vai latgaliešu valodā?
Latgaliešu valodai/dialektam ir name:ltg, līvu tiek lietots name:liv.
Tā kā ir gadījumi, kad pamatnosaukums tomēr tiek lietots latgaliešu valodā, tad 2) Latgalē jāapstrādā atsevišķi - neliekot trūkstošo name:lv no name, ja ir norādīts name:ltg. Šobrīd gan tādi gadījumi OSM datos ir uz gatera strādnieka rokas pirkstiem saskaitāmi. Elementus, kas atbilst atlases nosacījumiem, atliek vai nu izskatīt manuāli, vai atstāt vēlākam laikam.
1) nosacījumā jāapstrādā arī alt_name. Papildus nāk klāt nosacījums dzēst alt_name, ja sakrīt ar name:ltg (vadoties pēc wiki).
Off-topic, bet, skatoties, kas tagots ar name_1, atradās šāds ar visai interesantu vēsturi: https://www.openstreetmap.org/node/1684473449/history
Ņemot vērā iepriekšējos ieteikumus par latgaliešu valodu un tulkojumu nepazaudēšanu gadījumos, kad vēlāk tiek pievienoti nosaukumi citās valodas, kas atšķiras no name, kā arī papildinot ar vēl dažiem nosacījumiem, loģika izskatās šāda:
--1. Trim values.
---Nodes.
---Ways.
---Relations.
--2. Remove semicolons at the end of values.
---Nodes.
---Ways.
---Relations.
--3. Trim and sort multiple semicolon separated values in alt_name* and old_name* keys.
---Nodes.
---Ways.
---Relations.
--4. If missing, add name equal to name:lv if it's already present. name:lv might be deleted in later steps.
---Nodes.
---Ways.
---Relations.
--5. Remove multilingual names if all match default name.
---Exclude some keys in Latgale.
----Nodes. In Latgale, exclude key "place".
----Ways. In Latgale, exclude keys "place", "natural" and "waterway".
----Relations.
---In Latgale, keep *name:lv and *name:ltg keys as in some cases Latgalian might be used as name and otherwise it might be impossible to distinguish which language is used.
----Nodes. Only key "place".
----Ways. Only keys "place", "natural" and "waterway".
----Relations. Only keys "place", "natural" and "waterway".
--Remove multilingual alt_names if all match default alt_name. Identical principles to name except for ways and relations exclude cross border features having name in more than one language.
---Exclude some keys in Latgale.
----Nodes. In Latgale, exclude key "place".
----Ways. In Latgale, exclude keys "place", "natural" and "waterway".
----Relations.
---In Latgale, keep *alt_name:lv and *alt_name:ltg keys as in some cases Latgalian might be used as alt_name and otherwise it might be impossible to distinguish which language is used.
----Nodes. Only key "place".
----Ways. Only keys "place", "natural" and "waterway".
----Relations. Only keys "place", "natural" and "waterway".
--Remove multilingual old_names if all match default old_name. Identical principles to alt_name.
---Exclude some keys in Latgale.
----Nodes. In Latgale, exclude key "place".
----Ways. In Latgale, exclude keys "place", "natural" and "waterway".
----Relations.
---In Latgale, keep *old_name:lv and *old_name:ltg keys as in some cases Latgalian might be used as old_name and otherwise it might be impossible to distinguish which language is used.
----Nodes. Only key "place".
----Ways. Only keys "place", "natural" and "waterway".
----Relations. Only keys "place", "natural" and "waterway".
--6. From history, restore multilingual names all matching default name if multilingual names that differ from the default name have been added. In case of multiple values for the same key, retrieve the latest.
---Nodes.
---Ways.
---Relations.
--7. Remove alt_name if it matches name:ltg.
---Nodes.
---Ways.
---Relations.
--8. For isolated dwellings, remove multilingual names.
---Exclude Latgale.
----Nodes.
----Ways.
----Relations.
---In Latgale, keep only name:lv and name:ltg.
----Nodes.
----Ways.
----Relations.
--9. If missing, add name:lv that equals default name if multilingual names that differ from the default name exist.
---Exclude Latgale.
----Nodes.
----Ways.
----Relations.
---In Latgale, don't add name:lv if name matches name:lgt as some names use Latgalian as default name.
----Nodes.
----Ways.
----Relations.
Viensētu nosaukumi nav jātulko, atstāju vienīgi latgaliešu valodā Latgalē. Citādi šobrīd ir tādi gadījumi kā https://www.openstreetmap.org/node/653417496/history, kad kāds sameklējis visus objektus ar attiecīgo nosaukumu pievienojis tulkojumus, lai gan jātulko bija tikai ciema nosaukums.
Trim and sort multiple semicolon separated values
Kāpēc sort? Retāks nosaukums var būt speciāli vēlāk ielikts. Visādos sarakstos būs zemāk.
Wiki kaut kur ir aprakstīts, ka alt_name un old_name secībai ir jābūt pēc nozīmības? https://wiki.openstreetmap.org/wiki/Semi-colon_value_separator, https://wiki.openstreetmap.org/wiki/Key:alt_name un https://wiki.openstreetmap.org/wiki/Key:old_name neko tādu neatradu.
Bet vai tad kaut kur minēts, ka nozīmes nav?
Ja ir nozīme, tad tad ir jābūt kaut kur minētai. Ja nav minēts, tad nebūtu pamata pieņemt, ka būtu kāda nozīme.
Tās Ērgļu māju nosaukuma transliterācijas gan mazliet velk uz ņemšanu nost, kādas jums domas?
Es nonestu. Tā ir mehāniska neapspriesta rediģēšana. Bet nu, no otras puses neviens īpaši neiebilda pret mehānisko "Krasta Street" tulkošanu https://osmlatvija.zulipchat.com/#narrow/stream/358602-general/topic/Ielu.20nosaukumu.20tulkojumi
Nav jau tā, ka neviens neiebilda. Tur būtu Nominatim tulkojumiem jābūt nomenklatūras (VZD terminoloģijā) vārdiem, tad varētu Latvijā visus name:en ielām dzēst. Kamēr to nav, tikmēr izskatās, ka lielākajām tiek atbalstīta atstāšana. Viensētu nosaukumi nav jātulko vispār, ja neskaita latgaliešu valodu Latgalē, līdz ar to priekšlikums ir tos visus dzēst, ne tikai vienām Ērgļu mājām, kas bija tikai kā piemērs.
Varētu pakustināt šo. Kādi citiem viedokļi par alt_name* and old_name* vērtību sakārtošanu alfabētiski, ja ir vairākas vērtības?
Arīdzan ieskatam pielikumā ekselis ar tagiem, kas tiktu mainīti, realizējot https://osmlatvija.github.io/zulip-archive/stream/358602-general/topic/name.20un.20name.3Alv.html#373929668 aprakstīto. Dati oktobra sākumā.
osm_names_check.xlsx
Skatoties esošos name var redzēt, cik daudz salikti nepareizi...
ŠItajā tabulā ir name=xxx -> name=xxx + name:lv=xxx . Es varbūt nesaprotu sarakstu, bet, ja nav citu ne-lv name:xx, tad name:lv nebija plānots likt?
Jā, to arī pamanīju, uzkrītoši. Šis būtu par labu nemainīt vispār neko, jo, ja satagots šķībi nosaukumu tagos, tad liela iespējamība, ka ir vēl problēmas. Tikai apjoms tūkstošos, nav īsti resursu visu manuāli labot.
HellMap said:
Kāpēc sort? Retāks nosaukums var būt speciāli vēlāk ielikts. Visādos sarakstos būs zemāk.
HellMap said:
Bet vai tad kaut kur minēts, ka nozīmes nav?
@HellMap Tev pret alt_name* and old_name* vērtību sakārtošanu alfabētiski joprojām ir iebildumi?
Ņemot vērā, cik mums to gadījumu, man principā vienalga, ja tie salfabetizēsies. Es jau neiešu kaut ko labot un mainīt un prasīt katram gadījumam, kāpēc secība tāda. Bet principā OSM semikolona atdalītām vērtību secībai bieži ir nozīme, tāpēc es sliektos uzskatīt, ka nozīme ir un secība jāsaglabā. Pietiktu ar vienu gadījumu, lai parādītu, ka ir nozīme. Es varētu tādu gadījumu vienmēr uztaisīt, piemēram name=Burtnieks alt_name=Burtnieku ezers;Astjervs https://www.ezeri.lv/database/1846/ . Vai es tādu Astrjevs liktu pirmo? Diez vai. Bet nu no otras puses to visu jāsabāž Wikidatā ar avotiem, gadiem utt. nevis OSM, un secību teorētiski izlems aplikācija. Tāpēc es stipri nepārdzīvošu.
Jā, ir tagi, kur vērtību secībai ir nozīme, bet tā tad parasti ir arī aprakstīta (piem., seamark:buoy_lateral:colour no https://blog.jochentopf.com/2013-09-23-semicolons-in-osm-tags.html). Ir tagi kā cuisine, kuriem ir garas diskusijas par to, vai ir secībai nozīme vai nav. Piemērs par Burtnieku, protams, ir uzskatāms, bet neiztēlojos, kā to varētu uzturēt, jo, ja vai nu visas vērtības nav sakārtotas loģiskā (kas reizēm ir subjektīva) secībā, vai arī nevar norādīt, vai norādītā secība ir domāta ar nozīmi, tad no izmantošanas viedokļa dati tāpat ir nesakārtoti. Uzturēt sakārtotu prasa tik lielus cilvēkresursus, kuru mums Latvijā nav.
old_name=* var būt arī sadalīts pa laikposmiem, piem., old_name:1921-1932= .
Bet nu to tikai dažiem objektiem būtu vērts likt. Brīvības, Miera ielas Rīgā, piem.
Tā kā alt_name nekur plaši nav noteikts, vai secībai nozīme ir vai nav, tad to katrs ir licis, kā gribējis pēc OSM principiem "vispirms tego, pēc tam DE maillistā strīdās". Tāpēc es nepārdzīvošu par šitiem, ja gribi standartizēt un gribās alfabetizēt. Es gan teiktu if it's not broken, don't fix it. Ja secībai bija nozīme - sakārtošana to nodzēsīs. Ja nebija nozīme - tad arī nekas nemainīsies.
Changeset komentāru gan varēja labāku.
https://wiki.openstreetmap.org/wiki/Automated_edits/Latvia-bot/Tags
Nākamajam būs addresses un tags. Bota wiki lapa taču konkrēti aprakstīts. Būtu vēl kaut kafas cita tipa izmsiņas tad jau vispār refucētos uz automated updates in Latvia vai k-kā tā.
Es gan noteikti gribētu, lai adrešu izmaiņas un šitās tegu izmaiņas būtu ar atsevišķiem changesetiem. Jau tā ir ļoti grūti pārskatīt bota izmaiņas, jo tur simtiem izmaiņu. Bet ja būs vēl kopā dažāda tipa izmaiņas - kļūs grūtāk. Piemēram, pašlaik var atrast ielu nosaukumu izmaiņas un tamlīdzīgi no adrešu importa, jo tegu izmaiņas visas līdzīgas.
Automated edits gan ir teikts "A "comment" tag to the changeset that describes the changes made in this changeset in a human-readable way." un "You must link to the wiki page or user page documenting your changes from changeset".
Nodalīti changeseti izklausās ļoti labi, problēmu gadījumos būs daudz, daudz vieglāk.
Saite uz wiki ir no lietotāja lapas. Ņemot vērā, ka tiek komentāri visiem changeset būtībā ir vienādi, nešķiet, ka būtu jēga likt saiti arī pie changeset. Pielikt jau, protams, var, bet, vai vajag. Izsekot jau var arī tagad.
Par changesetu nodalīšanu pa tēmām - no izsekojamības viedokļa piekrītu, bet tehniski, ņemot vērā, kā bots ir veidots, to ir ķēpīgi realizēt, kā arī apstrāde būtiski paildzinātos.
OsmCha galīgi nelādē changesetu, jo tur pa daudz izmaiņu. Tik daudz protams nekad vairs nebūs, bet šo izmaiņu apskatīties nav iespējams. JOSM pārāk ilgi lādē (>1h, es atcēlu), jo katram elementam vēsturi velk no API. Achavi normāli ielādē, bet tur grūti kaut ko sameklēt.
https://www.openstreetmap.org/way/38146830 diez vai Latviski nosaukums ir "Ventspils - Nynäshamn" (t.b Nīneshamna). Šitam elementam viduspunkts nav Latvijas robežās, tāpēc es vispār nebūtu gaidījis, ka to mainītu. Internacionālus maršrutus drošvien vispār nevajadzētu iekļaut, bet tur gan jātaisa "kas ir maršruts?" tegu saraksts.
https://www.openstreetmap.org/way/37900596/history name:la=* ir Latīņu, to nevajadzēja aiztikt, kaut arī tas bija nepareizi. B0ta lapā nekas par "la" (vai citiem) nav minēts, tāpēc grūti uzminēt, kurš punkts te izpildījās.
Šeit piemēram :la atstāja https://www.openstreetmap.org/way/1066754066/history (bet te atšķirīgs)
Hmm, tam maršrutam teorētiski nebija jābūt iekļautam, jo šķērso robežu, būs japaskatās, kāpec nav nostrādājis, kā domāts.
Tur, kur :la, pielika :lv, jo ir nosaukums citā valodā. Tas tā kā būtu atbilstoši aprakstam.
Te piemērs, kur name nebija latviski. https://www.openstreetmap.org/way/624510910 Protams tas ir GIGO, bet nu tas tā piemēram, ka ne visu kartētāji liek latviski name vai nelatviskos name:xx.
Pēc bota loģikas šis OK. Name būtu jābūt latviski. Šis jālabo manuāli šā kā tā.
Par alt name secību piemērs - https://www.openstreetmap.org/relation/1108902 "Vecpilsēta;Iekšrīga" -> "Iekšrīga;Vecpilsēta". Es neteiktu, ka vēsturisks "Iekšrīga" ir svarīgāks par "Vecpilsēta", kas ir arī tagadējais apkaimes nosaukums. Bet nu esmu daļēji samierinājies, ka tos sortē/tīra priekš salīdzināšanas un b0ts nevar citādi. Tāpēc pieminu for the record.
Dāvis Kļaviņš said:
Šis jālabo manuāli šā kā tā.
Jā, kā saku, es to minu piemēram, nevis, ka tas nepareizi. Tas no lietotāja viedokļa, ka tas nebija name = name:lv.
Te b0ts lieku atstarpi nodzēsa citā tegā. https://www.openstreetmap.org/node/11196585246/history Tas gan laikam nav speciāli, bet drošvien automātiski kaut kas nosanatizējis? Vienīgi, kāpēc tas punkts vispār iekļāvies uploadu sarakstā, jo tur nav nekas labojams?
Trim ir visām vērtībām, šim konkrēti note beigās bija lieka atstarpe.
Ā, tu gribi teikt, ka trim ir vienmēr un visam, ne tikai elementiem, kur kaut kas nozīmīgs labots
Jā, kā pirmā darbība, pirms kaut ko tālāk sāk darīt.
https://www.openstreetmap.org/way/624510910 salaboju tagus manuāli. Izskatās gan, ka tur multipoligons būtu jāveido.
Dāvis Kļaviņš said:
Hmm, tam maršrutam teorētiski nebija jābūt iekļautam, jo šķērso robežu, būs japaskatās, kāpec nav nostrādājis, kā domāts.
Iemesls būtu skaidrs - nākamā node aiz Ventspils ostas ir Zviedrijas teritoriālajos ūdeņos un attiecīgi nav saglabājusies pēc Geofabrik datu apstrādes ar osmupdate, izgriežot pēc aptuvenās robežas, līdz ar to ceļš apgriezts tā, ka izbeidzas turpat ostā un attiecīgi ar robežu nekrustojas. Būs jāpielabo.
A kurš īsti punkts šeit nostrādāja: https://www.openstreetmap.org/node/2790112177/history ? Vai te pieliktais old name laika posmam ir nepareizs pēc kaut kāda faktora?
Kļūda skriptā, būs jāsalabo.
Kodā izlaboju.
Last updated: Dec 22 2024 at 03:46 UTC