banjalukaforum.com
https://www.banjalukaforum.com/

Promjena charseta u HTML stranicama
https://www.banjalukaforum.com/viewtopic.php?f=11&t=49917
Stranica 1 od 1

Autoru:  Vader [ 23 Maj 2010, 14:42 ]
Tema posta:  Promjena charseta u HTML stranicama

Imam gotove stranice u

charset=iso-8859-2

dakle

Kod:
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-2">


Želim da ih prebacim u utf-8 tako da bude

Kod:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">



Kada to uradim tako što samo editujem tu liniju u, na primjer, Notepadu tada ta stranica pogubi naša slova (š-č-ć-đ-ž), dobijem hijeroglife umjesto njih. Primjetio sam da kada snimam ovako editovanu HTML stranicu preko Save As u Notepadu dole u polju Encodin stoji ANSI, i sinoć kad sam to prebacio na UTF-8 i uz stavljanje utf-8 u meta tag sve je bilo OK, meta tag ima utf-8 za charset a stranica nije izgubila naša slova. No međutim danas mi ta radnja ne uspijeva :-? (ko zna šta sam i kako sinoć uspio). Sada kad god u meta tagu "charset=iso-8859-2" zamjenim sa "charset=utf-8" i to snimim u Notepadu ta stranica nakon toga pogubi naša slova, bez obzira da li u Notepadu snimam sa ANSI ili sa UTF-8 encodingom.

Ista stvar ako u Dreamweaveru napravim zamjenu u meta tagu na velikom broju postojećih HTML stranica gdje kod svih zamjenim "charset=iso-8859-2" sa "charset=utf-8", nakon toga te stranice ne prikazuju naša slova.

Kratko i jednostavno pitanje: kako da na većem broju postojećih stranica koje su u "charset=iso-8859-2" (i koje kao takve rade kako treba) prebacim u "charset=utf-8" a da stranice pri tome izgledaju kako treba, da nakon te zamjene i dalje uredno prikazuju naša slova?

Autoru:  pragmacorp [ 23 Maj 2010, 19:31 ]
Tema posta:  Re: Promjena charseta u HTML stranicama

Pogledaj ovo :

http://www.w3.org/International/questio ... g-encoding

i ovo

http://www.w3.org/International/tutoria ... -char-enc/

i ovo

http://www.w3.org/International/tutoria ... ontenttype

:)

Autoru:  Vader [ 24 Maj 2010, 11:07 ]
Tema posta:  Re: Promjena charseta u HTML stranicama

Tu se govori uopšteno o unicode charsetu a što se tiče konverzije već gotovih stranica (ono što mene zanima) kaže da se prvo stranica snimi sa utf-8 (It is not sufficient to just change the declarations inside your pages to say that the page is encoded in UTF-8. You must ensure that your data is actually encoded, ie. saved, in UTF-8) pa da se tek onda u meta tagu stavi utf-8, ali meni to juče i danas ne radi. Otvorim HTML stranicu u Notepadu, idem na Save As i dole stoji da je ANSI, to promjenim u UTF-8 i snimim je, ali mi nakon toga ne prikazuje slovo "ž" i "š", ostala slova su OK. Mada, sad sam to uradio preko Notepad++ i to je prošlo kako treba, obični Notepad dodaje BOM pri snimanju (iako možda to nije glavni problem). Sa Notepad++ se može uraditi converzija u UTF-8 sa ili bez BOM, i to radi kako treba. Sad me zanima kako da tu konverziju automatizovano uradim na većem broju HTML stranica. Probao sam sa njegovom macro funkcijom ali ne radi, moguće da nisam još shvatio kako se sa njom radi, snimim neku akciju kao macro i kad je kasnije pokrenem na drugom dokumentu ništa se ne desi.

Autoru:  The_new_Statesman [ 24 Maj 2010, 11:47 ]
Tema posta:  Re: Promjena charseta u HTML stranicama

Hej, moze glupo pitanje? Moze? Da nije do hostinga?
Ili jos gluplji prijedlog, pokusaj tekst prelijepiti u Google editor, pa ponovo nazad? Lupam gluposti danas, a? Ne bavim se sa tim, ali se susretnom jednom u pet godina :)

Autoru:  Vader [ 24 Maj 2010, 12:04 ]
Tema posta:  Re: Promjena charseta u HTML stranicama

Nije hosting, stranice prikazuju kako treba i u charset=iso-8859-2 i u utf-8, samo bih ja htio da ih sve prebacim u utf-8 pa me zanima kako da to uradim automatski na većem broju stranica. Znam da ih trebam prvo konvertovati u UTF-8 i to se može uraditi preko Notepad++, pa se onda u meta tag ubaci charset=utf-8, dakle dva koraka od kojih ovaj drugi mogu lako uraditi automatizovano na većem broju stranica, ali me zanima kako da ovaj prvi korak uradim odjednom.

Autoru:  The_new_Statesman [ 24 Maj 2010, 12:06 ]
Tema posta:  Re: Promjena charseta u HTML stranicama

Hm, nemam pojma, nisam to nikad pokusavao.

Autoru:  pragmacorp [ 25 Maj 2010, 07:15 ]
Tema posta:  Re: Promjena charseta u HTML stranicama

Vader je napisao:
Tu se govori uopšteno o unicode charsetu a što se tiče konverzije već gotovih stranica (ono što mene zanima) kaže da se prvo stranica snimi sa utf-8 (It is not sufficient to just change the declarations inside your pages to say that the page is encoded in UTF-8. You must ensure that your data is actually encoded, ie. saved, in UTF-8) pa da se tek onda u meta tagu stavi utf-8, ali meni to juče i danas ne radi. Otvorim HTML stranicu u Notepadu, idem na Save As i dole stoji da je ANSI, to promjenim u UTF-8 i snimim je, ali mi nakon toga ne prikazuje slovo "ž" i "š", ostala slova su OK. Mada, sad sam to uradio preko Notepad++ i to je prošlo kako treba, obični Notepad dodaje BOM pri snimanju (iako možda to nije glavni problem). Sa Notepad++ se može uraditi converzija u UTF-8 sa ili bez BOM, i to radi kako treba. Sad me zanima kako da tu konverziju automatizovano uradim na većem broju HTML stranica. Probao sam sa njegovom macro funkcijom ali ne radi, moguće da nisam još shvatio kako se sa njom radi, snimim neku akciju kao macro i kad je kasnije pokrenem na drugom dokumentu ništa se ne desi.


Sto se tice editora, UltraEdit je po mom skromnom misljenju najbolji :), u svakom slucaju ja vecinu stvari vezanih za web radim u visual studio u kom je utf-8 po defaultu podesen... by the way, mozda su ti ž i š kodovani ranije nečim što nije utf-8 pa ih zato ne prikazuje. To mi zvuči logično u ovom tvom scenariju, ako uzmeš u obzir da ti nakon snimanja u utf-8 sve sem ta dva karaktera prikazuje 'normalno' ...

Autoru:  Vader [ 25 Maj 2010, 11:49 ]
Tema posta:  Re: Promjena charseta u HTML stranicama

Da, kada u običnom Notepad snimim kao UTF-8 onda ne prikazuje samo ž i š.
A ako u Notepad++ odradim "Convert to UTF-8" onda sve prikazuje kako treba čak i bez da mijenjam charset=iso-8859-2 u HTML meta tagu.
Ali ako u Notepad++ odradim "Convert to UTF-8 without BOM" onda ništa ne prikazuje kako treba dok ne stavim u meta tag da je charset utf-8.

Autoru:  Hristov [ 25 Maj 2010, 13:25 ]
Tema posta:  Re: Promjena charseta u HTML stranicama

Vaderu, ako su specijalni znakovi vec bili unutra dok je encoding bio iso-8859-2, onda nije dovoljno samo promijeniti charset u UTF-8, nego moras pomocu nekog programa konvertora da konvertujes citav fajl u UTF-8, i tek onda ima smisla u meta tag pisati UTF-8. Znaci ako gore u meta tag-u stoji UTF-8, onda citav fajl (citav tekst) mora biti sa UTF-8 kodiran. Nisam procitao sve postove, ali vidim da koristis Notepad++. Uradi slijedece: otvori fajl sa Notepad++ dok mu je charset iso-8859-2, i onda konvertuj u UTF-8 (imas opciju u meniju), i onda napisi charset=UTF-8, sacuvaj fajl i otvori ga u browseru. Trebalo bi da nasa slova budu tacno prikazana.

Autoru:  Vader [ 25 Maj 2010, 13:37 ]
Tema posta:  Re: Promjena charseta u HTML stranicama

Već sam pisao o tome :), čak i u postu iznad ovog tvog :)

Pitanje je bilo kako veći broj postojećih stranica odjednom konvertovati u UTF-8? Mogu jednu po jednu tako kako si napisao, to sam i uradio, ali me zanima kako da to uradim automatizovano na većem broju stranica.

Autoru:  Hristov [ 25 Maj 2010, 13:42 ]
Tema posta:  Re: Promjena charseta u HTML stranicama

Potrazi na netu neki program koji tako nesto radi :D :)

EDIT: kad budes trazio taj program obrati paznju da mora biti specijalno za HTML stranice, jer taj program mora i da meta tag podesi, tako da charset bude UTF-8

Autoru:  Vader [ 25 Maj 2010, 13:49 ]
Tema posta:  Re: Promjena charseta u HTML stranicama

Tražio sam :)

Ne znam da li bi UltraEdit mogao to odraditi, ali on se koliko vidim plaća.

Meta tag mogu kasnije podesiti ručno, to nije problem, to se može uraditi automatizovano na većem broju HTML stranica i u Dreamweaveru i u Notepad++.

Stranica 1 od 1 Sva vremena su u UTC [ DST ]
Powered by phpBB® Forum Software © phpBB Group
http://www.phpbb.com/