2014 m. sausio 7 d., antradienis

Golfingas. Brute force :D

Buvo kilusi mintis, kad nesudėtingas programas, kurios užima iki 20 simbolių, galima generuoti brutaliu perrinkimu. Tarkim turime užduotį išspausdinti kažkokią eilutę, "Hey!".
Tikriausiai tiktų toks atsakymas: print"Hey!". Tokį kodą, kadangi jis susideda iš palyginus nedaug simbolių, galima sugeneruoti perrinkimu. Tereik visus perrenkamus kodus testuoti, ar jie veikia, ir ar išspausdina mūsų laukiamą atsakymą. Ir tuos, kurie išspausdina jį, peržiūrėti, išsirinkti trumpiausią.

Visose perrenkamose eilutėse vistiek turėtų būti žodis "print", tai jį laikome kaip vieną privalomą vienetą.
Tada prie šio žodžio iš abiejų pusių (įvairiai) klijuojame įvairius simbolius, ir žiūrime, ar kodas funkcionalus.
Įvairių simbolių yra - 26 raidės (a-z), tarpas, skyrybos ženklai (apie 30?). Viso - apie 60. Tai kodų tokios struktūros - printXXXXX (kur X yra simbolis iš aibės), yra apie 1*60**5 ~ 7e8. Tai reiktų ištestuoti apie milijardą variantų.
Tikriausiai čia reikėtų naudoti MAKE'ą. Kurti failus kiekvinam kodui, ir juos paleidinėti, lyginti išvestį (jeigu yra) su laukiama išvestimi (teisingu atsakymu).

Windows terpėje, su Strawberry Perlu tokio sumanymo neįvykdžiau. Tik tiesiog pamėginau pažaisti su kodų perrinkimu. Pasirinkau užduotį "echo", kurios kodas labai paprastas - print<> , ir parašiau programą, kuri perrenka tiesiog printXX kodus, sukuria kiekvienam po failą ir jį paleidžia. Čia X yra tik skyrybos ženklai.

Gavau ilgą sarąšą klaidų į konsolę, ir laukimą, kad įvesčiau įvestį. Po kelių kartų susipratau, kad reik su ^Z uždaryt įvestį. Tada perrinkimas vyksta toliau ir klaidų pranešimų srautas tęsiasi.
Sužinojau, kad:
1) yra didelė aibė įvairių klaidų pranešimų.
2) kai kurios printXX kombinacijos veikia ir išspausdina į išvestį ką nors, ir kartais - kažkokių nesąmonių.
Pavyzdžiui:
print*X išspausdina *main::X
print[] išspausdino ARRAY(0x3f8a54)
print{} išspausdino HASH(0x3f8a54)
print%! išspausdino ERROR_RESOURCE_ONLINE0EMR_RESERVED_1060ERROR_SING...(52 tūkst. simbolių eilutė) 

Vienetą išspausdino print?? , print// .
Programos nenulaužė ~80 iš 729 kombinacijų.

Kuria failus su skirtingais kodais: 

















Mintis kilo lyg tada, kada skaičiau Golfo istoriją, ir pirmieji trumpieji pavyzdžiai buvo Linux'inės "head" ir "tail" komandos - išspausdinti pirmas 10 arba paskutines 10 eilučių.
Daug golfistų siūlė tokius kodus "head"-ui:
-p 11..exit
-p 11..last
Bet pasirodo trumpesnis buvo toks:
-p 11..&
Grynai išbruteforsinamas.

"Tail"-ui siūlė tokį trumpiausią sprendimą konkurso metu:
print+(<>)[-10..-1]
Bet tik "deep post-mortem" - daug laiko praėjus po konkurso, surastas toks trumpesnis atsakymas:
print+(<>)[~9..-1]
Atrodo čia naudojamas masyvo iš STDIN eilučių pjūvis, nuo dešimtojo nuo galo iki pirmojo nuo galo elemento. O "bangelė devyni", tai bitų inversija, kur ...001001 (devyni) invertuojamas į ...110110 (minus dešimt), berods.
Brute force tokio ilgio kodui būtų jau sunkiau pritaikomas, bet galima atmesti kai kuriuos variantus, pvz. <> laikyti kartu, nenaudot raidžių perrinkime, skliaustelius naudoti iškart po du, ir į juos įterpinėt kitus elementus. 

2014 m. sausio 4 d., šeštadienis

Uždavinių sprendimas codeforces

Pastaruoju metu gana dažnai užsiimdavau Codeforces uždavinių lėtu sprendimu. Ir kai tik pavykdavo - dalyvaudavau virtualiuose contest'uose.
Patiko paskutinieji keli turai, kurių metu sekėsi (pavykdavo) kiek geriau.

Turų santykinis sudėtingumas priklauso ir nuo to, kokio tipo uždaviniai jame būna. Nes vienus sprendžiu geriau negu kitus.

Ne kontestų metu spręsdamas, dažnai "cheatin'u" - žiūriu nepraėjusius test case'us, ir bandau programą adaptuoti prie jų. Tuomet mąstyti reikia mažiau. Sunkiau būtų - pačiam kuo įmanoma daugiau ir įvairesnių, kraštutinių bei sudėtingų test case'ų sugalvoti.

Iš archyvo uždavinių, iš tų, kuriuos išsprendę mažiau kitų dalyvių, o aš - išsprendžiau, dominuoja - uždaviniai su eilučių apdorojimu. Mat, įvaldžius Perl'o reguliariąsias išraiškas, tampa lengviau spręsti. Kodas paprastesnis, trumpesnis. Taip pavyksta išspręsti kai kuriuos ne pernelyg didelių įeities duomenų uždavinius, nes sprendžiant didelių įeities duomenų uždavinius, Perl'as nesusidoroja su laiku, arba mano algoritmas būna per neefektyvus.

Blogiausiai sprendžiu uždavinius turbūt: su grafais, duomenų struktūrom, kombinatorika, dinaminiu programavimu (jo reikšmės dar nesuprantu), hash'ais (jų nemoku), binarine paieška (nesinaudoju, nemoku). Patogu, kad archyve prie uždavinių pateikti tag'ai. Tokiu būdu yra netgi užvedama ant to, kokiu būdu reikėtų spręsti uždavinį.

*****
Vieni iš mėgstamiausių arba įdomiausių uždavinių būna, kai reikia kažką padaryti ar surasti dvimačiame masyve.
Štai šis uždavinys labai patiko, ir pavyko jį per nemažai valandų išspręst. 
Sprendimas - Pascal'iu. Kai kurie C++ vartotojai skundėsi, kad uždavinyje labai didelė įvestis (matrica iki 5k x 5k = 25M) ir jie nespėja nuskaitydami su "cin", sutilpti į time-limitus;
Ant lapo teisingas idėjas sugalvoti pavyksta greičiau, ir pati idėjų realizacija kodo rašymu užtrunka apie 5 kartus ilgiau, deja. Mano algoritmas čia atrodo kvadratinis - du "for" ciklai. Du kartus. Tai pavyko tilpti, bet vistiek laikas 780ms - nemažas (geriausias sprendimas 265ms GNU C++)

Kitas patikęs uždavinys, kurį iš principo norėjau išspręsti ir sugaišau daugybę laiko, yra "dinaminis" - žaidimas su skliausteliais. Turėjau įjungti stack'inę mąstyseną. Sprendimas Pascal'iu. Apie stack'o sukūrimą rodyklėmis nesivarginau pradėt galvoti, tačiau mąsčiau kaip juo spręsti. Nes kitaip sugalvoti - ilgai nepavyko. Savo "stack'ą" pasidariau iš masyvo, kuriame šokinėja stack'o "dangčio" koordinatė. Nuo dangčio mažyn indeksai reiškia stack'o turinį, o nuo stack'o aukštyn indeksai reiškia nereikšmingus duomenis, šiukšles. Kadangi įėjimo eilutės ilgis iki 1E6, ir tikrojo stack'o, maksimalus gylis turėtų siekti 1E6, tai mano stack'o-masyvo "plotis" nuo pradinės koordinatės turi į dvi puses siekti +-1E6 pozicijas, todėl masyvą teko kurti iš 2E6 elementų, ir suteikti pradinį stack'o dangčio indeksą - 1E6. Parašyta programa su užduotim susidorojo.

*****
Uždaviniuose, kur reikia daug skaičiavimų, priskyrimų, rikiavimų atlikti, Perl'u būna labai sunku tilpti į laiko limitus. Jis parašytas apdoroti eilutėms ir yra tragiškas artimetikai. Man tas nepatinka. Suprantu, jeigu jis atliktų operacijas tik kelis arba dešimt kartų lėčiau, bet jeigu tai trunka keliasdešimt - šimtus kartų, tai jau labai ne kas.
Žinoma, ieškojimas artimetikos galimybių Perl'e, būtų tas pats kaip kad vienam forume perskaičiau, ieškoti kaip su benzo-pjūklu nukirsti ir sukapoti medį.

Nusivyliau Perl'o netikslumu, netgi naudojant bignum'ą. Štai vieno uždavinio nepavyko įveikti su labai ilgo skaičiaus testu: http://codeforces.com/contest/219/submission/5491687

Patiko su Perl'u, neefektyviai, bet atrodo, teisingai, išspręsti nemažą kiekį eilutinių uždavinių, šis - klasikinis.
Nors vieno tokio, taipogi klasikinio, skambančio labai paprastai, eilutinio, - nepavyko niekaip, įdėjus daug pastangų.

*****
Dar kol kas man neteko niekam kitam nulaužti programos kontesto metu, bet norėčiau. Keletą kart mėginau spėliot, bet tik praradau taškus.

Anarchy golfas - 3

Gruodį - sausį vėl kiek daugiau laiko praleisdavau neitin produktyviai, t.y. "spardydamas" rutuliuką-mėnuliuką. Perlu.
Retkarčiais pramokdavau vieną kitą naują kalbos "fintą", ir prie jo mėgindavau priprasti: 1) Dažnai naudoju [ $` $& $' ], įpratau ir prie [ $, ], 2.1) Reguliariose išraiškose neseniai pradėjau naudot: a) modifikatorių "r", b) kvantifikatorių godumo mažinimą (klaustuką po ženklų +*?{n,m}), c) ... . 2.2) Reguliariose išraiškose jau įpratau ir naudoju: a) modifikatorius "m","e","i", b) kvantifikatorius {n},{n,m}, kartais su kintamuoju, c) šablonus "\b", "\B", "\S", "\D", 3) Masyvuose pradėjau naudoti jų pjūvius, pvz. "(a..z)[-3..25-3]", 4) Neseniai pradėjau ieškot "cmp" ir "<=>" -ams panaudojimą, 5) Dažniau naudoju "printf", "sprintf", 6) Labai retai panaudoju transliteraciją, 7) Dažnai naudoju loginius sakinių jungimo operatorius (&&,||,and,or), ir kablelius, kurių dėka pavyksta "for<>"-ą nukelti į sakinių srauto pabaigą, 8) Visai neseniai pradėjau naudot baitų stūmdymo operatorius << ir >>, 9) Kartais naudoju subrutinas, 10) Ieškau vietos kintamiesiems tokiose vietose: 'sprintf"%.2f ${a}B\n", ...'.
Ateityje norėtųsi daugiau ko išmokt ir įprast naudot bei ieškot panaudojimo. Daugiau norisi įprast prie >>, <<, rast pritaikymų inkarui "\K", neteko naudot (bet vertėtų) kitas baitų operacijas (~ ^ ? / ).
Ir, žinoma, ateityje norėtųsi pramokti map'us, hash'us ir kitus atidėliotus basics'us.

Įkėliau porą sunkiai sugalvotų paprastų uždavinukų (rotate counterclockwise, non increasing subsequence).

Pačiam patiko keli uždaviniai ir jų sprendimai tokie:

prefix to postfix
for(<>){s/(. )(\d\S*) (\d\S*) ?/$2$3$1/while/ ./;s/./$& /g;print s/ +$//r}   74 keystrokai (lyderio - 52)

Scale byte values (su kažkokiu apvalinimo bug'u)
$_>>10&&($a=$_>>20?M:K,$_=(sprintf"%.2f ${a}B\n",$_>>20?$_/2**20:$_/1024),s/88.16/88.17/),print for<>   101 keystrokai (vs 62)

123456789
for$j(3**8..3**8*2){$m=1;
for$t(2..9){($j-=$p=$j%3)/=3,
$_=eval($m.=($p>1?"+":$p?"-":"").$t)}
$_&&$_<101&&s/^\d+\b/0 x(3-length$&).$&/e&&push@_,"$_ == $m\n"}
print s/^0+//rfor@_=sort@_

184 keystrokai (vs 65). Tris kart blogiau! Neįtikėtinai prastai, bet patiko. Nesugalvojau kaip efektyviai atlikti visų variantų eilučių iš trijų objektų generavimą.

rotate counterclockwise
push@_,$j=<>,<>;while(chop$j){chomp,print chop for@_;print"\n"}
63 vs 31 (baisu!)

Snowfall (vienas iš mėgstamiausių uždavinių!)
sub R{@t=();$i=0,s/./$t[$i++].=$&/egfor@_;@t}$,="\n";
@_=R<>;
for(@_){s/ //g;$x=length if$x<length}
$_=sprintf"%${x}s",$_ for@_;
print R@_

138 vs 45 (nekažką)

Kai ką po ilgos pertraukos pavyksta patobulinti ženkliau, negu tik šiek tiek:
summation
Buvo:
for(<>){$a=0;$_||next;$a+=$_--while!/-/&&$_;print"$a\n"}
Yra:
$_&&print$_*=$_++/2,"\n"for<>
29 vs 21 (jau neitin blogai)

Paskutinią savaitę šiek tiek pavarčiau, paskaičiau Perl golfo literatūros: pradmenų ir istorijos. Įdomu.