„.txt” változatai közötti eltérés
(.txt sorvég ... Unix és a Microsoft) |
(Unix szó javítás) |
||
(2 közbenső módosítás ugyanattól a szerkesztőtől nincs mutatva) | |||
1. sor: | 1. sor: | ||
− | A .txt általában szöveges állományok kiterjesztése. A szöveges [[fájl]]ok karaktereket tartalmazó, különböző hosszúságú sorokból épülnek fel. Minden sort az <code><b>End Of Line</b></code> ([[ | + | A .txt általában szöveges állományok kiterjesztése. A szöveges [[fájl]]ok karaktereket tartalmazó, különböző hosszúságú sorokból épülnek fel. Minden sort az <code><b>End Of Line</b></code> ([[Unix]] rendszereken LF, a Microsoft ettől eltérően CR+LF) karakterekkel zárja le. A szöveges állományokat tetszőleges szövegszerkesztővel létrehozhatjuk. |
A text típusú szövegfájlok az elérésük és használatuk szempontjából a szekvenciális, vagy más néven a soros fájlokhoz tartoznak. Amely azt jelenti, hogy a fájl adatelemeit csak sorban egymás után érjük el. | A text típusú szövegfájlok az elérésük és használatuk szempontjából a szekvenciális, vagy más néven a soros fájlokhoz tartoznak. Amely azt jelenti, hogy a fájl adatelemeit csak sorban egymás után érjük el. | ||
8. sor: | 8. sor: | ||
* FTP fájlátvitel során az ''asc'' parancs ASCII módba kapcsol, aholis ha szükséges, akkor a UNIX LF karakterét átkonvertálja CR+LF karakterpárossá. | * FTP fájlátvitel során az ''asc'' parancs ASCII módba kapcsol, aholis ha szükséges, akkor a UNIX LF karakterét átkonvertálja CR+LF karakterpárossá. | ||
* Linux esetén a tofrodos csomag ''fromdos xy.txt'' parancsa távolítja el a CR karaktereket a szövegfájlból. | * Linux esetén a tofrodos csomag ''fromdos xy.txt'' parancsa távolítja el a CR karaktereket a szövegfájlból. | ||
+ | |||
+ | == Problémák a karakterkódolással kapcsolatban == | ||
+ | |||
+ | Klasszikusan az angol nyelvben nem jelenlevő karaktereket akkor jeleníti meg jól, ha ugyanabban a karakterkódolásban lett létrehozva, mint amiben meg lesz jelenítve. | ||
+ | A Linux disztribúciók 2003-tól folyamatosan áttértek [[UTF-8]] kódolásra, így a szövegfájl ASCII 0..127 közötti angol nyelvű karakterkészletén túl már [[Unicode]] szerint akármelyik nyelv akármelyik karakterkészletét képes (akár szavanként felváltva is) alkalmazni. | ||
+ | |||
+ | TXT fájl konvertálása iso8859-2 -ről utf8 karakterkódolásra: | ||
+ | :<source lang=bash>iconv -f iso8859-2 -t utf8 < bemenő.txt > kimenő.txt</source> | ||
+ | |||
+ | Megjegyzés: visszafelé (utf8 --> iso8859-2) nem feltétlenül konvertálható, például ha az iso8859-2 -től eltérő karaktereket is tartalmaz az UTF-8 szerint karakterkódolt txt fájl. | ||
[[Kategória:Kiterjesztések]] | [[Kategória:Kiterjesztések]] |
A lap jelenlegi, 2010. szeptember 7., 01:38-kori változata
A .txt általában szöveges állományok kiterjesztése. A szöveges fájlok karaktereket tartalmazó, különböző hosszúságú sorokból épülnek fel. Minden sort az End Of Line
(Unix rendszereken LF, a Microsoft ettől eltérően CR+LF) karakterekkel zárja le. A szöveges állományokat tetszőleges szövegszerkesztővel létrehozhatjuk.
A text típusú szövegfájlok az elérésük és használatuk szempontjából a szekvenciális, vagy más néven a soros fájlokhoz tartoznak. Amely azt jelenti, hogy a fájl adatelemeit csak sorban egymás után érjük el.
Problémák és megoldásuk LF és CR+LF lezárás okán[szerkesztés]
- Microsoft rendszerein gyakran nem lesz új sor az LF karakterrel lezárt sorokat tartalmazó TXT fájl, hanem egysoros ömledékként jelenik meg.
- UNIX rendszereken, beleértve a Linuxot, gyakran jelzik a szoftverek, hogy parazita CR karaktert tartalmaz a szöveg.
- FTP fájlátvitel során az asc parancs ASCII módba kapcsol, aholis ha szükséges, akkor a UNIX LF karakterét átkonvertálja CR+LF karakterpárossá.
- Linux esetén a tofrodos csomag fromdos xy.txt parancsa távolítja el a CR karaktereket a szövegfájlból.
Problémák a karakterkódolással kapcsolatban[szerkesztés]
Klasszikusan az angol nyelvben nem jelenlevő karaktereket akkor jeleníti meg jól, ha ugyanabban a karakterkódolásban lett létrehozva, mint amiben meg lesz jelenítve. A Linux disztribúciók 2003-tól folyamatosan áttértek UTF-8 kódolásra, így a szövegfájl ASCII 0..127 közötti angol nyelvű karakterkészletén túl már Unicode szerint akármelyik nyelv akármelyik karakterkészletét képes (akár szavanként felváltva is) alkalmazni.
TXT fájl konvertálása iso8859-2 -ről utf8 karakterkódolásra:
iconv -f iso8859-2 -t utf8 < bemenő.txt > kimenő.txt
Megjegyzés: visszafelé (utf8 --> iso8859-2) nem feltétlenül konvertálható, például ha az iso8859-2 -től eltérő karaktereket is tartalmaz az UTF-8 szerint karakterkódolt txt fájl.