Elem, da otvorim mozda zanimljivu temu, o prakticnoj upotrebi LLM za pisanje koda, odnosno programiranje.
U konkretnom slucaju sledeci "use case scenario":
Porodica ima arhivu od ~20k iphone fotografija na racunaru (DCIM folder) a zele izvuci sve na kojima se nalazi jedan od clanova koji je nedavno umro.
Pregledati jednu po jednu fotografiju nije prakticno, pa sam odlucio smisliti rjesenje koje ce skenirati cijeli folder sa fotografijama a u slucaju "live" photo odnosno mov fajla izvuci middle frame i skenirati lica, te ako se desi poklapanje sliku ili frame kopirati u novi folder.
Pocetni prompt na Grok-u je bio tipa "I need to identify all photos on which one particular person is present, by this person face, cropped from one of the photos.
Grok je predlozio insightface i modele za face detection i face recognition (ima ih nekoliko, koristili smo buffalo_l).
Napisao mi je kod, python sa GUI, input folder, target face, output folder. Inicijalno, execution provider je bio CPU, ali to bese previse sporo pa je grok napisao installer skriptu za win + requirements.txt.
Conda env, pa u env python i potrebne modele itd itd.
Sa GPU je islo drasticno brze i posao je odradjen.
Trebalo je ukupno par sati debugovanja i testiranja i fine tunninga oko threshold podesavanja, ali na kraju je sve funkcionisalo besprekorno.
Dalje sam dosao do jos nekoliko ideja koje je grok odlicno shvatio i odradio sto je trazeno, i za sada evo kako to izgleda, mislim na GUI:

Naravno trazio sam detaljan debug output i evo par linija:
2025-06-03 18:30:39,315 - DEBUG: Processing file 3108/9334: E:/Archive/DCIM\JPG\IMG_0734.JPG
2025-06-03 18:30:41,042 - DEBUG: Detected 42 faces in E:/Archive/DCIM\JPG\IMG_0734.JPG
2025-06-03 18:30:41,042 - DEBUG: Raw embedding shape for face 1 in E:/Archive/DCIM\JPG\IMG_0734.JPG: (512,)
2025-06-03 18:30:41,042 - DEBUG: Face 1 in E:/Archive/DCIM\JPG\IMG_0734.JPG: similarity=-0.029
2025-06-03 18:30:41,042 - DEBUG: Raw embedding shape for face 2 in E:/Archive/DCIM\JPG\IMG_0734.JPG: (512,)
2025-06-03 18:30:41,043 - DEBUG: Face 2 in E:/Archive/DCIM\JPG\IMG_0734.JPG: similarity=-0.028
2025-06-03 18:30:41,043 - DEBUG: Raw embedding shape for face 3 in E:/Archive/DCIM\JPG\IMG_0734.JPG: (512,)
2025-06-03 18:30:41,043 - DEBUG: Face 3 in E:/Archive/DCIM\JPG\IMG_0734.JPG: similarity=0.019
itd itd.
Sa screenshota se vidi koje sve funkcije trenutno postoje, a moguce je napraviti i paralelizaciju na dvije nvidia kartice. Sve ovo je napisao grok u osnovnoj besplatnoj verziji, ukupno 1215 linija koda.
Sledeca stvar za koju sam koristio grok je da mi napise skriptu da ripujem slike sa rmc sajta, da bih skenirao galeriju (da se pronadjem) jer je praktcno nemoguca misija pronaci sebe na tom sajtu u galeriji medju 1800 slika, prosto je interfejs ogranicen.
Odradjeno, poskidali sve fotografije unazad tri godine, nasao brdo slika za drugare a mene nema

.
Naravno, moram reci da sa vec imao solidno znanje iz materije, kako se koristi python, kako instalirati neki paket i slicno, dakle nisam neki laik, ali bez obzira na to grok je napisao detaljne instrukcije pa kontam da bi svako sa nekim minimalnim nivoom znanja mogao napraviti isto ili slicno.
Bilo bi zanimljivo vidjeti koliko bi kostalo da se slicna aplikacija napise prije 5 godina (a i tad su postojali face recognition/detection modeli).