„.txt” változatai közötti eltérés

Innen: Programozás Wiki
Ugrás a navigációhozUgrás a kereséshez
(utf-8 szójavítás)
(Unix szó javítás)
 
1. sor: 1. sor:
A .txt általában szöveges állományok kiterjesztése. A szöveges [[fájl]]ok karaktereket tartalmazó, különböző hosszúságú sorokból épülnek fel. Minden sort az <code><b>End Of Line</b></code> ([[UNIX]] rendszereken LF, a Microsoft ettől eltérően CR+LF) karakterekkel zárja le. A szöveges állományokat tetszőleges szövegszerkesztővel létrehozhatjuk.
+
A .txt általában szöveges állományok kiterjesztése. A szöveges [[fájl]]ok karaktereket tartalmazó, különböző hosszúságú sorokból épülnek fel. Minden sort az <code><b>End Of Line</b></code> ([[Unix]] rendszereken LF, a Microsoft ettől eltérően CR+LF) karakterekkel zárja le. A szöveges állományokat tetszőleges szövegszerkesztővel létrehozhatjuk.
 
A text típusú szövegfájlok az elérésük és használatuk szempontjából a szekvenciális, vagy más néven a soros fájlokhoz tartoznak. Amely azt jelenti, hogy a fájl adatelemeit csak sorban egymás után érjük el.
 
A text típusú szövegfájlok az elérésük és használatuk szempontjából a szekvenciális, vagy más néven a soros fájlokhoz tartoznak. Amely azt jelenti, hogy a fájl adatelemeit csak sorban egymás után érjük el.
  

A lap jelenlegi, 2010. szeptember 7., 01:38-kori változata

A .txt általában szöveges állományok kiterjesztése. A szöveges fájlok karaktereket tartalmazó, különböző hosszúságú sorokból épülnek fel. Minden sort az End Of Line (Unix rendszereken LF, a Microsoft ettől eltérően CR+LF) karakterekkel zárja le. A szöveges állományokat tetszőleges szövegszerkesztővel létrehozhatjuk. A text típusú szövegfájlok az elérésük és használatuk szempontjából a szekvenciális, vagy más néven a soros fájlokhoz tartoznak. Amely azt jelenti, hogy a fájl adatelemeit csak sorban egymás után érjük el.

Problémák és megoldásuk LF és CR+LF lezárás okán[szerkesztés]

  • Microsoft rendszerein gyakran nem lesz új sor az LF karakterrel lezárt sorokat tartalmazó TXT fájl, hanem egysoros ömledékként jelenik meg.
  • UNIX rendszereken, beleértve a Linuxot, gyakran jelzik a szoftverek, hogy parazita CR karaktert tartalmaz a szöveg.
  • FTP fájlátvitel során az asc parancs ASCII módba kapcsol, aholis ha szükséges, akkor a UNIX LF karakterét átkonvertálja CR+LF karakterpárossá.
  • Linux esetén a tofrodos csomag fromdos xy.txt parancsa távolítja el a CR karaktereket a szövegfájlból.

Problémák a karakterkódolással kapcsolatban[szerkesztés]

Klasszikusan az angol nyelvben nem jelenlevő karaktereket akkor jeleníti meg jól, ha ugyanabban a karakterkódolásban lett létrehozva, mint amiben meg lesz jelenítve. A Linux disztribúciók 2003-tól folyamatosan áttértek UTF-8 kódolásra, így a szövegfájl ASCII 0..127 közötti angol nyelvű karakterkészletén túl már Unicode szerint akármelyik nyelv akármelyik karakterkészletét képes (akár szavanként felváltva is) alkalmazni.

TXT fájl konvertálása iso8859-2 -ről utf8 karakterkódolásra:

iconv -f iso8859-2 -t utf8 < bemenő.txt > kimenő.txt

Megjegyzés: visszafelé (utf8 --> iso8859-2) nem feltétlenül konvertálható, például ha az iso8859-2 -től eltérő karaktereket is tartalmaz az UTF-8 szerint karakterkódolt txt fájl.