Formati tekstualnih datoteka. Tekstualni fajl Šta znači txt format?

UVOD

Gotovo svaki korisnik računara susreće se sa potrebom da pripremi određene dokumente - pisma, članke, dopise, izvještaje, reklamne materijale itd. Naravno, ovi dokumenti se mogu pripremiti i bez kompjutera, na primjer na pisaćoj mašini. Međutim, s pojavom personalni računari Postalo je mnogo lakše i praktičnije, a samim tim i isplativije pripremati dokumente pomoću računara.

Kada koristite personalne računare za pripremu dokumenata, tekst dokumenta koji se uređuje prikazuje se na ekranu, a korisnik može da izvrši promene u njemu na mreži. Sve napravljene promjene se odmah prikazuju na ekranu računara, a zatim se pri štampanju prikazuje lep i pravilno formatiran tekst, koji uzima u obzir sve ispravke koje korisnik izvrši. Korisnik može prenijeti dijelove teksta s jednog mjesta u dokumentu na drugo, koristiti nekoliko tipova fontova za isticanje pojedinih dijelova teksta i ispisati pripremljeni dokument na štampaču u potrebnom broju kopija.

Pogodnost i efikasnost korišćenja računara za pripremu tekstova dovela je do stvaranja mnogih programa za obradu dokumenata. Takvi programi se nazivaju uređivači teksta(Procesori teksta). Mogućnosti ovih programa su raznovrsne - od programa za izradu manjih dokumenata jednostavne strukture, do programa za kucanje, dizajn i kompletnu pripremu za štampu knjiga i časopisa (izdavačkih sistema).


Pre nego što počnete da istražujete meni MS-DOS Editor, trebalo bi da vežbate kucanje. Tekst se kuca sa tastature kao na običnoj pisaćoj mašini, na kraju svakog reda se pritisne Enter.

Da biste predugačku liniju razbili na dva, trebate pritisnuti Enter gdje bi trebao biti kraj reda.

Svakim pritiskom na Enter dodaje se prazan red. Ako formiraju se višak prazne linije, obrišite ih možete pritisnuti Shay Del.

Greške u tekstu možete ispraviti pomicanjem kursora preko radnog polja pomoću tipki ili miša. Da biste izbrisali znak, koristite taster Del ako je kursor ispred znaka koji želite da izbrišete ili taster Backspace ako je kursor iza znaka.

Ako trebate izbrisati znak samo da biste upisali drugi na njegovo mjesto, prikladnije je prebaciti tastaturu u način zamjene. Podrazumevano, tastatura je u režimu umetanja. Tipka Ins prebacuje između načina umetanja i zamjene.

Kada se umetnu, svi naredni znakovi se pomiču udesno.

Kada se zamijeni, trenutni znak nestaje.

Dokumenti kreirani u MS-DOS Editoru mogu se sačuvati u tekstualnim datotekama da biste to uradili, koristite meni File Save. Meni File Save As... će vam omogućiti da sačuvate datoteku pod drugim imenom.

Da obrišete uređivač i počnete raditi na novom fajlu, koristite meni File New. Da biste učitali gotovu datoteku u uređivač, koristite meni File Open. U dijaloškom panelu odaberite naziv tražene datoteke pomoću kursora. Meni File Print omogućava vam da odštampate ili izabrani deo dokumenta ili ceo tekst.

Među jednostavni uređivači LEXICON je najčešće korišteni tekst u Rusiji.

Leksikon za obradu teksta

Razvijen program za obradu teksta Leksikon E.N.Veselov 1985. godine u Računskom centru Akademije nauka SSSR-a. Od 1991. godine isporučuje ga kompanija Microinform. Ima interfejs na ruskom jeziku i omogućava vam da pripremite jednostavne dokumente sa tekstom na ruskom i engleski jezici. LEXICON uspješno ispunjava svoju „ekološku nišu“ - sasvim je pogodan za one kojima je potreban jednostavan alat za pripremu malih i jednostavnih dokumenata, a ne zahtijevaju visoku kvalitetu štampe.

Da biste započeli rad na novom fajlu, morate dati komandu menija Obriši tekst ili koristite bilo koji besplatni Lexicon prozor. Na raspolaganju je ukupno 10 prozora, i to pritiskom na A+ "qi fra na alfanumeričkoj tastaturi, možete otići do prozora sa odgovarajućim brojem.

Da učitate gotovu datoteku, koristite komandu menija Preuzmite tekst i kursorom izaberite naziv željene datoteke u meniju.

Naredba menija Ispis teksta t Start će vam omogućiti da odštampate dokument na štampaču ako je prekidač PRINTER1FILE 1SCREEN postavljen na položaj PRINTER. Kada ste u poziciji SCREEN, možete vidjeti kako će tačno izgledati tekst odštampan na štampaču.

Urednik MS-Word

Evo samo nekih od funkcija koje Word podržava:

· korištenje mnogo različitih fontova (veličina i stilova) znakova i na razne načine njihov naglasak (podebljan, kurziv, podvučeni znakovi, itd.); određivanje parametara pasusa teksta i stranica dokumenta; kucanje teksta u nekoliko kolona; ispis zaglavlja i podnožja bilo koje vrste; automatsko generisanje sadržaja i razne vrste znakovi;

· dizajn tabela i pasusa „uporedo”; uključivanje crteža ( grafičke datoteke); postavljanje pasusa (na primjer, slika) bilo gdje na stranici (ostatak teksta se može "savijati" oko slike).

Iskusni korisnici zaista cijene Wordove stilske karakteristike. Word vam omogućava da u takozvanu listu stilova zabilježite sve parametre najčešće korištenih tipova oblikovanja teksta: pasuse, znakove i dijelove dokumenta. Ako to učinite, tada se bilo kojem dijelu teksta može dodijeliti jedan od "standardnih" tipova dizajna jedan ili dva tasteri. Ovo ne samo da značajno ubrzava kucanje dokumenta, već i povećava fleksibilnost njegovog dizajna. Na primjer, da biste promijenili font i lokaciju svih naslova određenog nivoa (recimo, naslova pasusa), ne morate tražiti ove naslove i ručno mijenjati njihovo oblikovanje – samo ispravite stil za ove naslove i oni će automatski uzmite željeni dizajn.

Shift+Ctri sa "M""1", "N""SA", «(» i "5" (na desnoj strani tastature) su rezervisani.

Zapravo, postoji mnogo više „zabranjenih“ kombinacija. Ako za svoje programe definirate kombinacije sa Shiftom, tada će s vremena na vrijeme korisnik potpuno neočekivano "ispasti" iz uređivača teksta kada pokuša napisati veliko slovo, a kombinacije sa Alt neće biti uzaludne kada radite u programima gdje opcije menija se pozivaju Alt+slovo- baš kao u samom MS-DOS Shell-u. IN Microsoft Word Gotovo sve moguće kombinacije tipki rezervirane su za interne potrebe!

Sam preklopnik zadataka je program koji se zove DOSSWAP.EXE, koji se učitava prije bilo kojeg izvršavanja aplikativni program i izlazi nakon što program izađe, vraćajući se u MS-DOS Shell. Program DOSSWAP zauzima oko 30 KB RAM-a.

Nakon zatvaranja datoteke, asocijacija varijable datoteke sa fizičkom datotekom se ne prekida, a datoteka se može ponovo otvoriti bez dodatnog poziva procedure Assign.

Procedura zatvaranja se zatvara otvori datoteku

zatvori(promjenjiva_datoteke);

Zatvaranje datoteke osigurava da je fizička datoteka sigurna i potpuna.

Ako se program prekine zbog greške prije zatvaranja datoteke, datoteka će i dalje biti kreirana na mediju, ali sadržaj posljednjeg bafera neće biti prebačen u datoteku.

Ista stvar će se dogoditi ako zaboravite da ubacite Close poziv u program.


Tekstualni fajl je kolekcija nizova znakova promjenjive dužine.

Nizovi se sastoje od znakova u ASCII kodu za MS-DOS i ANSI kodu za Windows.

Može se kreirati i uređivati ​​pomoću bilo kojeg uređivača teksta Delphi, Lazarus ili Word, WorPad ili NotePad.

(Prilikom kreiranja u Delphiju, u glavnom meniju izaberite File ÞNew ÞOther, koji otvara dijalog New Items. Na kartici New izaberite ikonu Text i pritisnite taster OK

Kada kreirate u Lazarusu, izaberite File ÞNew iz glavnog menija, koji otvara dijalog New.... U dijaloškom okviru odaberite ModulÞText i pritisnite tipku OK).

Tekstualne datoteke imaju ekstenziju *.txt.

Šematski prikaz tekstualne datoteke:

Kontrolni znakovi #13 i #10 (povratak na liniju - unošenje sljedećih znakova će početi od prve pozicije, a pomicanje reda - unos će početi od praznog reda.).

Simboli #13 i #10 – marker kraja linije.

Prazan niz sadrži samo znakove #13 i #10.

Na kraju datoteke nalazi se znak za kraj datoteke - kontrolni znak #26 ( marker kraja datoteke).

Prazan tekstualni fajl sadrži jedan znak #26.

Prilikom pisanja brojeva, nizova i boolean vrijednosti oni se pretvaraju u simbolički (tekstualni) oblik.

Prilikom čitanja brojeva i nizova, oni se automatski pretvaraju iz tekstualnog prikaza u strojni prikaz.

Da biste radili s tekstualnom datotekom, morate definirati varijablu datoteke:

Ako je datoteka otvorena za pisanje (procedura ponovnog pisanja), dozvoljeno je samo pisanje podataka.

Ako je datoteka otvorena za čitanje (procedura resetovanja), dozvoljeno je samo čitanje.

Čitanje podataka iz tekstualne datoteke vrši se procedurama Read i Readln:

Čitaj

Readln(file_variable, input_list);

input_list – lista varijabli karakternih, string, cijelih i realnih tipova.

Složene strukturirane tipove (kao što su nizovi, skupovi, zapisi, itd.) mogu se unositi samo elementi (po poljima zapisa).

Nakon čitanja određene komponente, pokazivač datoteke se pomiče na sljedeću komponentu.


Ako čitate datoteku u varijablu char, tada procedura Read čita jedan znak. Kada se dostigne kraj reda, rezultat čitanja su znakovi na kraju reda, #13 i #10, a kada se dostigne kraj datoteke, znak za kraj datoteke, #26, je pročitano.

Dok čita vrijednost u cjelobrojnu ili realnu varijablu Prvo se izdvaja podniz u kojem se uklanjaju svi vodeći razmaci, tabulatori (#9) i markeri na kraju reda.

Čitanje se zaustavlja kada naiđe na prvi razmak, marker na kraju reda ili znak tabulatora.

Pročitani niz digitalnih znakova se konvertuje u broj, koji se dodeljuje odgovarajućoj promenljivoj.

Sljedeća operacija čitanja počinje razmakom (markerom na kraju reda, znakom tabulatora, itd.).

Ako odabrani podniz sadrži nenumeričke znakove, dolazi do I/O greške.

Dok čitate podatke u niz varijablu Procedura Read čita sve znakove do markera kraja reda.

Ako je broj znakova reda u datoteci veći od broja navedenog u deklaraciji varijable stringa, onda se dodatni znakovi ne čitaju.

Ako je procedura Read pročitala određeni red u cijelosti, onda sljedeći put kada se pozove, čitanje počinje na markeru kraja reda, što znači da će biti pročitan red nulte dužine.

Procedura Read ne prebacuje pokazivač datoteke na sljedeći red znakova i stoga se ne može koristiti za čitanje niza redova.

Readln procedura čita sve znakove u redu do i uključujući terminator, što tjera pokazivač datoteke na novi red.

Procedura se može pozvati bez ulazne liste, što će uzrokovati da se pokazivač na datoteku pomakne na početak sljedećeg reda datoteke bez čitanja prethodnog reda.

Kada koristite Readln proceduru za čitanje brojeva, imajte na umu da će nakon čitanja posljednje cifre broja svi znakovi teksta koji su ostali prije markera kraja reda biti preskočeni, a prvi znak sljedećeg reda tekstualni fajl će postati dostupan.


Pisanje u tekstualnu datoteku se vrši pomoću procedura Pisati I Writeln:

Pisati

Writeln(file_variable, output_list);

Ovdje je file_variable varijabla tipa text;

output_list je lista varijabli ili izraza karakternog, niza, cijelog broja, realnog ili Booleovog tipa.

Razlika između Write i Writeln procedura je u tome što se red koji je upisan u datoteku koristeći Writeln proceduru završava znakom za kraj linije.

Ako se Writeln procedura koristi bez izlazne liste, prazan niz se upisuje u datoteku.

Da biste pročitali sve podatke iz tekstualne datoteke, trebate koristiti funkciju Eof, koji određuje da li je dostignut kraj datoteke. Sintaksa za pozivanje ove funkcije.

Eof(promjenjiva_datoteke);

Vraća logičku vrijednost. Ako je pokazivač datoteke izvan posljednjeg elementa datoteke, ili ako je datoteka prazna, funkcija vraća True. U suprotnom vraća False.

Koje sadrže podatke koji nisu namijenjeni da se tumače kao tekst (na primjer, datoteke koje pohranjuju tekst u kodiranom ili komprimiranom obliku, ili koje pohranjuju zvuk, sliku ili druge podatke umjesto teksta).

Tekstualni fajl

MIME tip tekst/običan
Nasuprot binarni fajl
Ekstenzija datoteke .poruka ili .text
Medijski fajlovi na Wikimedia Commons

Za razliku od pojma "tekstualni podaci" ( tekstualni format podaci) koji karakteriše sadržaj podataka, termin "tekstualni fajl" odnosi se na datoteku i karakteriše je kao kontejner u kome se takvi podaci pohranjuju.

Opis

Tekstualna datoteka sadrži niz znakova (uglavnom znakova koji se mogu ispisati koji pripadaju određenom skupu znakova). Ovi znakovi se obično grupišu u redove (engleske linije, redovi). IN savremeni sistemi Iako su stringovi razdvojeni separatorima linija, u prošlosti su oni pohranjivali nizove kao zapise konstantne ili promjenjive dužine (pogledajte: Bušene kartice). Ponekad je kraj tekstualne datoteke (naročito ako sistem podataka informacije o veličini datoteke se ne pohranjuju) je također označen sa jednim ili više specijalni znakovi, poznati kao markeri kraja datoteke.

Prednosti i nedostaci

Prednosti:

  • Univerzalnost - tekstualni fajl se može čitati (na ovaj ili onaj način) na bilo kom sistemu ili OS-u, posebno ako govorimo o jednobajtnim kodiranjem kao što je ASCII, koji nisu podložni problemu koji je karakterističan za druge formate datoteka - oni to rade nije briga za razlike u redoslijedu bajtova ili riječi dužine stroja na različitim platformama.
  • Trajnost - svaka riječ i znak u takvoj datoteci su samostalni i, ako se bajtovi u takvoj datoteci pokvare, obično je moguće oporaviti podatke ili nastaviti obradu ostatka sadržaja, dok kod komprimiranih ili binarnih datoteka dolazi do oštećenja od nekoliko bajtova može učiniti datoteku potpuno nepopravljivom. Mnogi sistemi za kontrolu verzija dizajnirani su za tekstualne datoteke i mogu samo upravljati binarnim datotekama kao cjelinom.
  • Format tekstualne datoteke je izuzetno jednostavan i može se mijenjati pomoću uređivača teksta - programa uključenog u gotovo svaki OS.

Nedostaci:

  • Velike nekomprimirane tekstualne datoteke imaju nisku entropiju informacija - ove datoteke zauzimaju više prostora od potrebnog minimuma. Iako ova redundantnost određuje povećanu otpornost na kvarove u kanalima za prijenos podataka i pri primanju podataka s medija, na primjer, s magnetne trake.
  • Neke operacije sa tekstualnim datotekama su neefikasne. Na primjer, ako se neki broj pronađe u datoteci, računarski sistem će, prije nego što počne s radom s njim, morati da ga konvertuje u svoj interni format, koristeći relativno složenu proceduru konverzije brojeva; da biste prešli na 1000. red, morate izbrojati 999 redova koji idu prije njega; teško je zamijeniti jedan red drugim itd. Stoga, kada se radi sa velikim količinama podataka, tekstualne datoteke se koriste samo kao srednji format koji osigurava interoperabilnost.

Formati zasnovani na tekstualnim datotekama

Zbog svoje jednostavnosti, tekstualne datoteke se često koriste za pohranjivanje servisnih informacija (na primjer, dnevnika): budući da operacija dodavanja novih podataka na kraj tekstualne datoteke ne zahtijeva značajne računarske resurse, bez obzira na postojeću veličinu datoteku i vrstu tekstualnih podataka koji se dodaju, održavanje tekstualnih datoteka dnevnika obično se odvija efikasno i neprimijećeno od strane korisnika i drugih aplikacija (sve dok se ne iscrpi prostor na disku).

Format teksta služi kao osnova za mnoge specijalizovanije formate (na primjer, .ini, SGML, HTML, XML, TeX, izvorni kod programskog jezika). U nekim od ovih formata, određene kombinacije znakova mogu se koristiti kao alati za označavanje teksta. U tom slučaju, datoteka može pohraniti formatirani tekst, u kojem se znakovi mogu dodatno postaviti na font, stil, veličinu itd. (na primjer, Rich Text Format, HTML).

Ekstenzije naziva fajla

U DOS-u, Mac OS-u i Windows-u, obični tekstualni fajlovi obično koriste ekstenziju .txt. Međutim, tekstualne datoteke mogu biti datoteke sa bilo kojom drugom ekstenzijom ili bez iste. Na primjer, izvorni kodovi programa se obično pohranjuju u datoteke sa ekstenzijama koje odgovaraju programskom jeziku na kojem su programi napisani (.java, .bas, .pas, .c).

Obogaćeni tekst (tekst sa oznakama) obično se pohranjuje u datoteke sa ekstenzijom koja odgovara formatu ili jeziku za označavanje - .rtf, .htm, .html.

Kodiranja

8-bitni tekst

Istorijski gledano, 7-bitni ASCII skup znakova, kao i 8-bitni EBCDIC i razne ASCII ekstenzije, korišteni su za kodiranje tekstualnih datoteka. U 8-bitnom kodne stranice Uobičajeno je koristiti znakove koji odgovaraju ASCII-u u prvoj polovini tablice kodova.

Prednost 8-bitnog predstavljanja teksta je jednostavnost softvera i nezavisnost od problema sa redosledom bajtova ili dužinom mašinske reči na različitim platformama. Nedostatak je veliki broj različitih standarda, što može dovesti do nekompatibilnosti.

Unicode u tekstualnim datotekama

Iako upotreba Unicode-a u tekstualnim datotekama uglavnom rješava “problem kodiranja” i standardizira upotrebu kontrolnih znakova, stvara svoje probleme. U većini modernih sistema, nedjeljiva jedinica informacija u toku podataka je kartica (kod 9) i feed stranice (kod 0xC). Potonje su koristili stari uređivači teksta poput LEXICON-a, kao i u datotekama namijenjenim štampanju na štampaču.

Tekstualne datoteke

Tekstualne datoteke su dizajnirane za pohranjivanje tekstualnih informacija. U takvim se datotekama, na primjer, pohranjuju izvorni kodovi programa. Komponente tekstualne datoteke mogu imati promjenjivu dužinu, što značajno utiče na način na koji radite s njima. Svakom redu Pascal tekstualne datoteke može se pristupiti samo sekvencijalno, počevši od prvog. Procedure dodjeljivanja, resetiranja, ponovnog pisanja, čitanja, pisanja i funkcije eof primjenjive su na tekstualne datoteke. Prilikom kreiranja tekstualne datoteke, poseban znak EOLN (kraj reda) stavlja se na kraj svakog zapisa (reda). Da bi se utvrdilo da li je dostignut kraj reda, postoji logička funkcija istog imena EOLN(<имя_ф_переменной>), koji se procjenjuje na istinito ako se dostigne kraj niza.

Pored procedura čitanja i pisanja, pri radu sa tekstualnim datotekama koriste se njihove varijante readln i writeln. Razlika je u tome što procedura writeln, nakon pisanja date liste, upisuje poseban marker kraja reda u datoteku. Ovaj znak se doživljava kao prijelaz na nova linija. Readln procedura, nakon čitanja date liste, traži terminator sljedećeg reda u datoteci i priprema se za čitanje od početka sljedećeg reda.

Primjer rješavanja problema s datotekama

Pretpostavimo da trebamo generirati tekstualnu datoteku, a zatim je prepisati ovaj fajl u drugom, samo oni redovi koji počinju slovom “A” ili “a”.

Rješenje: trebat će nam dvije varijable datoteke f1 i f2, pošto su obje datoteke tekstualne, tip varijable će biti tekst. Zadatak je podijeljen u dvije faze: prva je formiranje prvog fajla; drugi je čitanje prve datoteke i generiranje druge, a zatim prikazivanje sadržaja druge datoteke na ekranu.

Program početnik;

Var f1,f2:tekst;

I,n: cijeli broj;

S:string;

Počni

(formirajte prvi fajl)

Dodijeli(f1, 'file1.txt'); (uspostavljamo vezu između varijable datoteke i fizičke datoteke na disku)

Prepiši (f1); (otvorite fajl za pisanje)

Readln(n) (odredite broj redova za unos)

za i:=1 do n do

početi

readln(s); (unesite nizove sa tastature)

writeln(f1,s); (pišemo sekvencijalne redove u fajl)

kraj;

zatvori(f1); (završavamo rad sa prvim fajlom, sada se na disku nalazi fajl file1.txt koji sadrži redove koje smo uneli. Program možemo završiti ovde, možemo nastaviti rad sa fajlom u drugom programu, u nekom drugom trenutku, ali nastavicemo)

(drugi dio: čitanje iz prve datoteke i formiranje druge)

Reset (f1); (otvorite prvi fajl za čitanje)

Dodijeli(f2, 'file2.txt'); (uspostavljamo vezu između druge varijable datoteke i fizičke datoteke)

Rewrite(f2); (otvorite drugi fajl za pisanje)

(Dalje, potrebno je uzastopno čitati redove iz prve datoteke, provjeriti da li je uvjet ispunjen i upisati tražene redove u drugu datoteku. Za čitanje iz tekstualne datoteke preporučuje se korištenje petlje prema uvjetu “ do kraja fajla”)

Dok to ne čini eof(f1).

Počni

Readln(f1,s);(pročitajte sljedeći red iz prve datoteke)

Ako (s=’A’) ili (s=’a’) onda

Writeln(f2,s); (u drugi fajl upisujemo redove koji zadovoljavaju uslov)

End;

Zatvori(f1,f2); (završavamo rad sa fajlovima)

(treći dio: prikaži drugi fajl)

Writeln;

Writeln('Drugi fajl sadrži redove:');

Resetuj(f2); (otvorite drugi fajl za čitanje)

Dok ne eof(f2) radi (do kraja drugog fajla)

Počni

Readln(f2,s);(pročitajte sljedeći red iz druge datoteke)

Writeln(s); (prikaži liniju na ekranu)

End;

Kraj.

Zadatak 1: Dat tekstualni fajl. Izbrojite broj redova u datoteci.

  1. Otvorite datoteku za čitanje;
  2. Organizirajte čitanje podataka iz datoteke red po red (readln(f,s), gdje je s varijabla tipa string), računajući vrijednost varijable brojača k u svakom koraku čitanja;
  3. Prikaz vrijednosti varijable brojača;
  4. Zatvorite fajl.

program z1;

var k:integer;

s:string;

f:tekst;

početi

dodijeli(f,"input.pas");

reset (f);

k:=0;

dok ne počinje eof(f).

readln(f,s); k:=k+1;kraj;

writeln("k=",k);

zatvori(f);

kraj.

Zadatak 2: Dat tekstualni fajl. Ispišite sve njegove redove počevši od znaka "T".

Kreirajmo algoritam za rješavanje problema (Kreirajte datoteku s tekstualnim podacima – input.pas prije nego počnete rješavati problem):

  1. Povežite logičku datoteku f sa fizičkom datotekom input.pas;
  2. Otvorite datoteku za čitanje;
  3. Organizirajte čitanje podataka iz datoteke red po red (readln(f,s), gdje je s varijabla tipa string), provjeravajući pri svakom koraku da li linija zadovoljava uvjet: prvi znak je “T”, i ako jeste, prikazati ovu liniju na ekranu;
  4. Zatvorite fajl.

program z2;

var k:integer;

s:string;

f:tekst;

početi

dodijeli(f,"input.pas");

reset (f);

dok ne počinje eof(f).

readln(f,s);

ako je s=’T’ onda writeln(s);

kraj;

zatvori (f);

kraj.

Zadatak 3: Dat tekstualni fajl. Ispišite sve njegove redove koji sadrže više od 30 znakova.

Kreirajmo algoritam za rješavanje problema (Kreirajte datoteku s tekstualnim podacima – input.pas prije nego počnete rješavati problem):

  1. Povežite logičku datoteku f sa fizičkom datotekom input.pas;
  2. Otvorite datoteku za čitanje;
  3. Organizirajte čitanje podataka iz datoteke red po red (readln(f,s), gdje je s varijabla tipa string), provjeravajući pri svakom koraku da li linija zadovoljava uvjet: dužina reda je veća od 30, i ako jeste, prikažite ova linija na ekranu;
  4. Zatvorite fajl.

program z3;

var k:integer;

s:string;

f:tekst;

početi

dodijeli(f,"input.pas");

reset (f);

dok ne počinje eof(f).

readln(f,s);

ako dužina(e)>=30 onda writeln(s);

kraj;

zatvori (f);

kraj.

Zadatak 4: Dat tekstualni fajl. Ispišite sve njegove redove koji sadrže dati tekst kao fragment.

Kreirajmo algoritam za rješavanje problema (Kreirajte datoteku s tekstualnim podacima – input.pas prije nego počnete rješavati problem):

  1. Povežite logičku datoteku f sa fizičkom datotekom input.pas;
  2. Otvorite datoteku za čitanje;
  3. Postavite fragment teksta za pretraživanje (s1);
  4. Organizirajte čitanje podataka iz datoteke red po red (readln(f,s), gdje je s varijabla tipa string), provjeravajući u svakom koraku da li linija zadovoljava uvjet: sadrži navedeni tekst (s1) kao fragment, i ako jeste, ispišite ovu liniju na ekran;
  5. Zatvorite fajl.

program z4;

var k:integer;

s1,s:string;

f:tekst;

početi

writeln('enterfragmenttekst’);

readln(s1);

dodijeli(f,"input.pas");

reset (f);

dok ne počinje eof(f).

readln(f,s);

ako pos(s1,s)<>0 zatim upis(e);

kraj;

zatvori (f);

kraj.

Zadatak 5: Dat tekstualni fajl. Odštampajte red 5 u novu tekstualnu datoteku, a ostatak na ekran.

Kreirajmo algoritam za rješavanje problema (Kreirajte datoteku s tekstualnim podacima – input.pas prije nego počnete rješavati problem):

  1. Povežite logičku datoteku f s fizičkom datotekom input.pas, a logičku datoteku g s fizičkom datotekom output.pas;
  2. Otvorite datoteku za čitanje;
  3. Organizirajte čitanje podataka iz datoteke red po red (readln(f,s), gdje je s varijabla tipa string), brojeći vrijednost varijable brojača k u svakom koraku čitanja i provjeravajući u svakom koraku da li je vrijednost brojača jednako 5, i ako je tako, onda iznesite ovu liniju u datoteku g, u suprotnom ispišite je na ekran;
  4. Zatvorite fajl.

program z5;

var k:integer;

s:string;

f,g:tekst;

početi

dodijeli(f,"input.pas");

reset (f);

dodijeliti(g,"output.pas");

rewrite(g);

k:=0;

dok ne počinje eof(f).

readln(f,s);k:=k+1;

ako je k=5 onda writeln(g,s);

kraj;

zatvori(f); zatvori(f);

Pripadnost jednom ili drugom skupu znakova). Ovi znakovi se obično grupišu u nizove. linije, redovi). U modernim sistemima, nizovi su odvojeni separatorima linija, ali u prošlosti su nizovi bili pohranjeni kao zapisi konstantne ili promjenjive dužine (pogledajte: Bušene kartice). Ponekad je kraj tekstualne datoteke (naročito ako sistem datoteka ne pohranjuje informacije o veličini datoteke) također označen jednim ili više posebnih znakova poznatih kao markeri za kraj datoteke.

Tekstualna datoteka može sadržavati i formatirani i neformatirani tekst.

Prednosti i nedostaci

Prednosti:

  • Univerzalnost - tekstualni fajl se može čitati (na ovaj ili onaj način) na bilo kom sistemu ili OS-u, posebno ako govorimo o jednobajtnim kodiranjem kao što je ASCII, koji nisu podložni problemu koji je karakterističan za druge formate datoteka - oni to rade nije briga za razlike u redoslijedu bajtova ili riječi dužine stroja na različitim platformama.
  • Trajnost - svaka riječ i znak u takvoj datoteci su samostalni i, ako se bajtovi u takvoj datoteci pokvare, obično je lakše oporaviti podatke i nastaviti s obradom ostatka sadržaja, dok je u komprimiranim ili binarnim datotekama oštećenje od nekoliko bajtova može onemogućiti oporavak cjelokupne datoteke sadržaja. Mnogi sistemi za kontrolu verzija dizajnirani su za tekstualne datoteke i mogu samo upravljati binarnim datotekama kao cjelinom.
  • Format tekstualne datoteke je izuzetno jednostavan i može se mijenjati pomoću uređivača teksta - programa uključenog u gotovo svaki OS.

Nedostaci:

  • Velike nekomprimirane tekstualne datoteke imaju nisku entropiju informacija - ove datoteke zauzimaju više prostora od potrebnog minimuma. Iako ova redundantnost određuje povećanu otpornost na kvarove u kanalima za prijenos podataka i pri primanju podataka s medija, na primjer, s magnetne trake.
  • Neke operacije sa tekstualnim datotekama su neefikasne. Na primjer, ako se neki broj pronađe u datoteci, računarski sistem će, prije nego što počne s radom s njim, morati da ga konvertuje u svoj interni format, koristeći relativno složenu proceduru konverzije brojeva; da biste prešli na 1000. red, morate izbrojati 999 redova koji idu prije njega; teško je zamijeniti jedan red drugim itd. Stoga, kada se radi sa velikim količinama podataka, tekstualne datoteke se koriste samo kao srednji format koji osigurava interoperabilnost.

Formati zasnovani na tekstualnim datotekama

Zbog svoje jednostavnosti, tekstualne datoteke se često koriste za pohranjivanje servisnih informacija (na primjer, dnevnika). Format teksta služi kao osnova za mnoge specijalizovanije formate (na primjer, .ini, SGML, HTML, XML, TeX, izvorni kod programskog jezika).

U tekstualnoj datoteci, tekst se može pohraniti ili neformatiran ili u formatiranom ili označenom obliku (na primjer, Rich Text Format, HTML), pri čemu se oblikovanje (font, stil, veličina, itd.) može primijeniti na svaki znak.

Ekstenzije naziva fajla

Unicode u tekstualnim datotekama

Iako upotreba Unicode-a u tekstualnim datotekama uglavnom rješava “problem kodiranja” i standardizira upotrebu kontrolnih znakova, stvara svoje probleme. U većini modernih sistema, nedjeljiva jedinica informacija u toku podataka je bajt (8 bitova), koji zahtijeva nekoliko da bi se kodirao jedan Unicode karakter. Kao rješenje koriste se nekompatibilni UTF-8 sistemi i dvije verzije UTF-16 (UTF-16LE i UTF-16BE sa suprotnim redoslijedom bajtova). Ponekad se na početak datoteke dodaje poseban znak markera (U+FEFF), što omogućava jedinstveno prepoznavanje formata. Međutim, UTF-8 ima prednost što je kompatibilan sa ASCII-om softverska obrada tekst u UTF-8 je komplikovan promenljivom veličinom karaktera. Takođe, Unicode tekstovi su još suvišniji od 8-bitnih.

Kontrolni znakovi

Različiti operativni sistemi imaju svoj vlastiti prikaz prijelaza reda i kraja datoteke. U UNIX-u, prijevod reda se sastoji od jednog LF znaka (kod 10), u Mac OS-u se sastoji od CR znaka (kod 13), a u DOS-u i Windowsu, prijevod reda se kodira kao niz od dva znaka: CR i LF.

Pored navedenih, tekstualne datoteke koriste simbole kao što su tab (šifra 9) i feed stranice (šifra 12).

vidi takođe

  • Tekst kao slika

Bilješke


Wikimedia Foundation. 2010.

  • Biblijska imena
  • Pokret za prava seksualnih i rodnih manjina

Pogledajte šta je "tekstualni fajl" u drugim rječnicima:

    tekstualnu datoteku- Datoteka koja sadrži redove pisanih informacija koje se mogu direktno ispisati na ekran ili štampač koristeći uobičajene komande operativnog sistema. Fajlovi kreirani u programima za obradu teksta nisu tekstualni fajlovi, jer... sadrže......

    Fajl (računar)- Koncept fajla (engleski folder, folder). kompjuterska tehnologija: entitet koji vam omogućava pristup resursu računarski sistem i ima niz karakteristika: fiksno ime (niz znakova, broj ili ... Wikipedia

    TEKST PROCESOR- (uređivač teksta), kompjuterski sistem, dizajniran za kreiranje i obradu teksta. Ako se sistem može koristiti samo u tu svrhu, onda se naziva specijalizovanim obradu teksta. Lični je češći... Naučno-tehnički enciklopedijski rečnik

    ASCII fajl- Tekstualni fajl koji sadrži samo znakove sa kodovima do 127 (sedmobitni ASCII skup znakova). Takav fajl ne sadrži simbole nacionalnih abeceda i pseudografske simbole. Teme informacione tehnologijeVodič za tehnički prevodilac

    definiciona datoteka- Posebna tekstualna datoteka koja sadrži direktive koje se koriste za povezivanje komponenti objekata programa (ili biblioteka) u izvršnu datoteku. [E.S. Aleksejev, A.A. Englesko-ruski rečnik objašnjenja o inženjerstvu računarskih sistema. Moskva 1993]… … Vodič za tehnički prevodilac

    fajl za inicijalizaciju- Posebna tekstualna datoteka koja se koristi prilikom učitavanja okruženja i pojedinačnih programa za početna instalacija parametri. [E.S. Aleksejev, A.A. Englesko-ruski rečnik objašnjenja o inženjerstvu računarskih sistema. Moskva 1993] Teme informacione tehnologije u ... Vodič za tehnički prevodilac

    File- Ovaj izraz ima druga značenja, pogledajte Fajl (značenja). Fajl (engleski fajl) je blok informacija na eksternom računarskom uređaju za skladištenje koji ima određenu logičku reprezentaciju (počevši od jednostavnog niza ... ... Wikipedia

    fajl- imenica, m., korištena. uporedi često Morfologija: (ne) šta? fajl, zar ne? fajl, (vidi) šta? fajl, šta? fajl, o čemu? o fajlu; pl. Šta? fajlovi, (ne) šta? fajlovi, šta? fajlovi, (vidim) šta? fajlovi, šta? fajlovi, o čemu? o fajlovima 1. Fajl je niz...... Rječnik Dmitrieva

    Konfiguracijski fajl- ili se konfiguracijska datoteka koristi za pohranjivanje postavki kompjuterski programi, uključujući operativni sistemi. obično, konfiguracijske datoteke imaju tekstualni format i može ih čitati i uređivati ​​korisnik programa.... ... Wikipedia

    datoteku sa riječima odvojenim za crticu- Fajl koji sadrži Tekstualni dokument, čije se riječi stavljaju na crticu pomoću posebne funkcije crtice. Teme Informaciona tehnologija općenito EN datoteka sa crticama ... Vodič za tehnički prevodilac

Knjige

  • Portfolio za prvi razred. Program vannastavnih aktivnosti. Metodološki priručnik (+CD), Umnova Marina Sergeevna, Dannaya radni program osmišljen da organizuje rad sa portfoliom učenika 1. razreda u okviru vannastavnih aktivnosti. Program je razvijen i sastavljen uzimajući u obzir Federalne... Kategorija: Vaspitno-obrazovni rad u školi Serija: Vodič za učionicu Izdavač:


Učitavanje...
Top