.txt

A Programozás Wiki wikiből

A .txt általában szöveges állományok kiterjesztése. A szöveges fájlok karaktereket tartalmazó, különböző hosszúságú sorokból épülnek fel. Minden sort az End Of Line (Unix rendszereken LF, a Microsoft ettől eltérően CR+LF) karakterekkel zárja le. A szöveges állományokat tetszőleges szövegszerkesztővel létrehozhatjuk. A text típusú szövegfájlok az elérésük és használatuk szempontjából a szekvenciális, vagy más néven a soros fájlokhoz tartoznak. Amely azt jelenti, hogy a fájl adatelemeit csak sorban egymás után érjük el.

Problémák és megoldásuk LF és CR+LF lezárás okán[szerkesztés]

  • Microsoft rendszerein gyakran nem lesz új sor az LF karakterrel lezárt sorokat tartalmazó TXT fájl, hanem egysoros ömledékként jelenik meg.
  • UNIX rendszereken, beleértve a Linuxot, gyakran jelzik a szoftverek, hogy parazita CR karaktert tartalmaz a szöveg.
  • FTP fájlátvitel során az asc parancs ASCII módba kapcsol, aholis ha szükséges, akkor a UNIX LF karakterét átkonvertálja CR+LF karakterpárossá.
  • Linux esetén a tofrodos csomag fromdos xy.txt parancsa távolítja el a CR karaktereket a szövegfájlból.

Problémák a karakterkódolással kapcsolatban[szerkesztés]

Klasszikusan az angol nyelvben nem jelenlevő karaktereket akkor jeleníti meg jól, ha ugyanabban a karakterkódolásban lett létrehozva, mint amiben meg lesz jelenítve. A Linux disztribúciók 2003-tól folyamatosan áttértek UTF-8 kódolásra, így a szövegfájl ASCII 0..127 közötti angol nyelvű karakterkészletén túl már Unicode szerint akármelyik nyelv akármelyik karakterkészletét képes (akár szavanként felváltva is) alkalmazni.

TXT fájl konvertálása iso8859-2 -ről utf8 karakterkódolásra:

iconv -f iso8859-2 -t utf8 < bemenő.txt > kimenő.txt

Megjegyzés: visszafelé (utf8 --> iso8859-2) nem feltétlenül konvertálható, például ha az iso8859-2 -től eltérő karaktereket is tartalmaz az UTF-8 szerint karakterkódolt txt fájl.