„.txt” változatai közötti eltérés
(Unix szó javítás) |
|||
(Egy közbenső módosítás ugyanattól a szerkesztőtől nincs mutatva) | |||
1. sor: | 1. sor: | ||
− | A .txt általában szöveges állományok kiterjesztése. A szöveges [[fájl]]ok karaktereket tartalmazó, különböző hosszúságú sorokból épülnek fel. Minden sort az <code><b>End Of Line</b></code> ([[ | + | A .txt általában szöveges állományok kiterjesztése. A szöveges [[fájl]]ok karaktereket tartalmazó, különböző hosszúságú sorokból épülnek fel. Minden sort az <code><b>End Of Line</b></code> ([[Unix]] rendszereken LF, a Microsoft ettől eltérően CR+LF) karakterekkel zárja le. A szöveges állományokat tetszőleges szövegszerkesztővel létrehozhatjuk. |
A text típusú szövegfájlok az elérésük és használatuk szempontjából a szekvenciális, vagy más néven a soros fájlokhoz tartoznak. Amely azt jelenti, hogy a fájl adatelemeit csak sorban egymás után érjük el. | A text típusú szövegfájlok az elérésük és használatuk szempontjából a szekvenciális, vagy más néven a soros fájlokhoz tartoznak. Amely azt jelenti, hogy a fájl adatelemeit csak sorban egymás után érjük el. | ||
12. sor: | 12. sor: | ||
Klasszikusan az angol nyelvben nem jelenlevő karaktereket akkor jeleníti meg jól, ha ugyanabban a karakterkódolásban lett létrehozva, mint amiben meg lesz jelenítve. | Klasszikusan az angol nyelvben nem jelenlevő karaktereket akkor jeleníti meg jól, ha ugyanabban a karakterkódolásban lett létrehozva, mint amiben meg lesz jelenítve. | ||
− | A Linux disztribúciók 2003-tól folyamatosan áttértek [[ | + | A Linux disztribúciók 2003-tól folyamatosan áttértek [[UTF-8]] kódolásra, így a szövegfájl ASCII 0..127 közötti angol nyelvű karakterkészletén túl már [[Unicode]] szerint akármelyik nyelv akármelyik karakterkészletét képes (akár szavanként felváltva is) alkalmazni. |
TXT fájl konvertálása iso8859-2 -ről utf8 karakterkódolásra: | TXT fájl konvertálása iso8859-2 -ről utf8 karakterkódolásra: | ||
:<source lang=bash>iconv -f iso8859-2 -t utf8 < bemenő.txt > kimenő.txt</source> | :<source lang=bash>iconv -f iso8859-2 -t utf8 < bemenő.txt > kimenő.txt</source> | ||
− | Megjegyzés: visszafelé (utf8 --> iso8859-2) nem feltétlenül konvertálható, például ha az iso8859-2 -től eltérő karaktereket is tartalmaz az | + | Megjegyzés: visszafelé (utf8 --> iso8859-2) nem feltétlenül konvertálható, például ha az iso8859-2 -től eltérő karaktereket is tartalmaz az UTF-8 szerint karakterkódolt txt fájl. |
[[Kategória:Kiterjesztések]] | [[Kategória:Kiterjesztések]] |
A lap jelenlegi, 2010. szeptember 7., 01:38-kori változata
A .txt általában szöveges állományok kiterjesztése. A szöveges fájlok karaktereket tartalmazó, különböző hosszúságú sorokból épülnek fel. Minden sort az End Of Line
(Unix rendszereken LF, a Microsoft ettől eltérően CR+LF) karakterekkel zárja le. A szöveges állományokat tetszőleges szövegszerkesztővel létrehozhatjuk.
A text típusú szövegfájlok az elérésük és használatuk szempontjából a szekvenciális, vagy más néven a soros fájlokhoz tartoznak. Amely azt jelenti, hogy a fájl adatelemeit csak sorban egymás után érjük el.
Problémák és megoldásuk LF és CR+LF lezárás okán[szerkesztés]
- Microsoft rendszerein gyakran nem lesz új sor az LF karakterrel lezárt sorokat tartalmazó TXT fájl, hanem egysoros ömledékként jelenik meg.
- UNIX rendszereken, beleértve a Linuxot, gyakran jelzik a szoftverek, hogy parazita CR karaktert tartalmaz a szöveg.
- FTP fájlátvitel során az asc parancs ASCII módba kapcsol, aholis ha szükséges, akkor a UNIX LF karakterét átkonvertálja CR+LF karakterpárossá.
- Linux esetén a tofrodos csomag fromdos xy.txt parancsa távolítja el a CR karaktereket a szövegfájlból.
Problémák a karakterkódolással kapcsolatban[szerkesztés]
Klasszikusan az angol nyelvben nem jelenlevő karaktereket akkor jeleníti meg jól, ha ugyanabban a karakterkódolásban lett létrehozva, mint amiben meg lesz jelenítve. A Linux disztribúciók 2003-tól folyamatosan áttértek UTF-8 kódolásra, így a szövegfájl ASCII 0..127 közötti angol nyelvű karakterkészletén túl már Unicode szerint akármelyik nyelv akármelyik karakterkészletét képes (akár szavanként felváltva is) alkalmazni.
TXT fájl konvertálása iso8859-2 -ről utf8 karakterkódolásra:
iconv -f iso8859-2 -t utf8 < bemenő.txt > kimenő.txt
Megjegyzés: visszafelé (utf8 --> iso8859-2) nem feltétlenül konvertálható, például ha az iso8859-2 -től eltérő karaktereket is tartalmaz az UTF-8 szerint karakterkódolt txt fájl.