Форматы текстовых файлов. Текстовый файл Что значит формат txt

ВВЕДЕНИЕ

Практически каждый пользователь компьютера встречается с необходимостью подготовки тех или иных документов - писем, статей, служебных записок, отчетов, рекламных материалов и т.д. Разумеется, эти документы можно подготавливать и без компьютера, например на пишущей машинке. Однако с появлением персональных компьютеров стало значительно проще и удобнее, а следовательно, и выгоднее подготавливать документы с помощью компьютеров.

При использовании персональных компьютеров для подготовки документов текст редактируемого документа выводится на экран, и пользователь может в диалоговом режиме вносить в него свои изменения. Все внесенные изменения сразу же отображаются на экране компьютера, и потом при распечатке выводится красиво и правильно оформленный текст, в котором учтены все сделанные пользователем исправления. Пользователь может переносить куски текста из одного места документа в другое, использовать несколько видов шрифтов для выделения отдельных участков текста, печатать подготовленный документ на принтере в нужном числе экземпляров.

Удобство и эффективность применения компьютеров для подготовки текстов привели к созданию множества программ для обработки документов. Такие программы называются редакторами текстов (Word Processors). Возможности этих программ различны - от программ, предназначенных для подготовки небольших документов простой структуры, до программ для набора, оформления и полной подготовки к типографскому изданию книг и журналов (издательские системы).


Прежде чем начать знакомство с меню редактора MS-DOS Editor, следует попрактиковаться в наборе текста. Текст набирается с клавиатуры как на обычной печатной машинке, в конце каждой строки нажимается Enter.

Чтобы разбить слишком длинную строку на две, надо нажать Enter там, где должен быть конец строки.

Каждое нажатие Enter добавляет пустую строку. Если образуются лишние устые строки, удалить их можно клави шей Del.

Можно поправить ошибки в тексте, перемещая курсор по рабочему полю клавишами или мышью. Для удаления символа надо воспользоваться клавишей Del если курсор стоит перед символом который надо удалить или клавишей Backspace если курсор стоит после это символа.

Если удалить символ нужно только для того, чтобы на его месте набрать другой, удобнее перевести клавиатуру в режим замены. По умолчанию клавиатура находится в режиме вставки. Переключателем между режимами вставки и замены служит клавиша Ins.

При вставке все последующие символы сдвигаются вправо.

При замене текущий символ исчезает.

Документы, создаваемые в редакторе MS-DOS Editor, можно сохранять в текстовых файлах, для этого следует пользоваться меню File Save. Меню File Save As... позволит сохранить файл под другим именем.

Для очистки редактора и начала работы над новым файлом служит меню File New. Чтобы загрузить уже готовый файл в редактор, воспользуйтесь меню File Open. В диалоговой панели следует выбрать курсором имя требуемого файла. Меню File Print позволяет распечатать на принтере либо выделенную часть документа, либо весь текст.

Среди простых редакторов текста в России наибольшее распространение получил ЛЕКСИКОН.

Текстовый процессор Лексикон

Текстовый процессор Лексикон разработан Е.Н.Веселовым в 1985 году в ВЦ АН СССР. С 1991 года поставляется фирмой «Мик-роинформ». Он имеет интерфейс на русском языке и позволяет подготавливать несложные документы с текстом на русском и английском языках. ЛЕКСИКОН удачно заполняет свою «экологическую нишу» - он вполне подойдет тем, кому нужен простой инструмент для подготовки небольших и несложных документов, причем от них не требуется высокого полиграфического качества.

Чтобы начать работу над новым файлом, необходимо дать команду меню Текст очистить или воспользоваться любым свободным окном Лексикона. Всего доступно 10 окон, и нажатием А +«ци фра на буквенно-цифровой клавиатуре можно перейти к окну с соответствующим номером.

Для загрузки уже готового файла следует использовать команду меню Текст загрузить и выбрать в меню курсором имя требуемого файла.

Команда меню Текст печать Старт позволит распечатать документ на принтере, если переключатель ПРИНТЕР1ФАЙ 1ЭКРА установлен в положение ПРИНТЕР. При положении ЭКРАН можно просмотреть, как в точности будет выглядеть распечатка текста на принтере.

Редактор MS-Word

Вот только некоторые из функций, поддерживаемых Word:

· использование множества различных шрифтов (размеров и начертаний) символов и различных способов их выделения (полужирные, курсивные, подчеркнутые символы и т.д.); указание параметров абзацев текста и страниц документа; набор текста в несколько колонок; печать верхних и нижних колонтитулов произвольного вида; автоматическое формирование оглавления и различных видов указателей;

· оформление таблиц и абзацев «бок о бок ; включение рисунков (графических файлов); размещение абзацев (например, рисунков) в любом месте страницы (остальной текст при этом может «огибать» рисунок).

Опытные пользователи очень ценят такую возможность Word, как стили. Word позволяет записать в так называемую таблицу стилей все параметры наиболее часто используемых видов оформления текста: абзацев, символов и разделов документа. Если сделать это, то затем любому участку текста можно будет присвоить один из «стандартных» видов оформления с помощью одного-двух нажатий клавиш. Это не только значительно ускоряет набор документа, но и повышает гибкость его оформления. Например, чтобы изменить шрифт и расположение у всех заголовков некоторого уровня (скажем, заголовков параграфов), не потребуется искать эти заголовки и вручную изменять их форматирование - достаточно исправить стиль для этих заголовков, и они автоматически примут нужное оформление.

Shift+Ctri с «М», «1», «Н», «С», «(» и «5» (в правой части клавиатуры) зарезервированы.

На самом деле «запрещенных» комбинаций гораздо больше. Если определить для своих программ сочетания с Shift, то время от времени пользователь будет совершенно неожиданно «выпадать» из редактора текста при попытке написать заглавную букву, а сочетания с Alt не пройдут даром при работе в программах, где опции меню вызываются на Alt+буква - как и в самой MS-DOS Shell. В Microsoft Word зарезервированы для внутренних нужд чуть ли не все возможные комбинации клавиш!

Сам переключатель задач - это программа DOSSWAP.EXE, которая загружается перед выполнением любой прикладной программы и заканчивает работу после завершения программы с возвращением в MS-DOS Shell. Программа DOSSWAP занимает около 30 Кбайт оперативной памяти.

После закрытия файла связь файловой переменной с физическим файлом не нарушается, и файл повторно может открываться без дополнительного вызова процедуры Assign.

Процедура close закрывает открытый файл

close (файловая_переменная);

Закрытие файла гарантирует сохранность и полноту заполнения физического файла.

Если программа прервалась из-за ошибки до закрытия файла, то он все-таки будет создан на носителе, но содержимое последнего буфера не будет перенесено в файл.

То же самое случится и в том случае, если вообще забыть поставить в программу вызова Close.


Текстовый файл это совокупность символьных строк переменной длины.

Строки состоят из символов в коде ASCII для MS-DOS и ANSI для Windows.

Его можно создавать и редактировать с помощью любого текстового редактора кода Dеlphi, Lazarus или Word, WorPad или NotePad.

(При создании в Delphi в главном меню следует выбрать File ÞNew ÞOther, при этом открывается диалоговое окно New Items. Во вкладыше New следует выделить пиктограмму Text и нажать клавишу Оk

При создании в Lazarus в главном меню следует выбрать Файл ÞСоздать, при этом открывается диалоговое окно Создать... . В диалоговом огне следует выбрать МодульÞТекст и нажать клавишу Оk).

Текстовые файлы имеют расширение *.txt.

Схематическое изображение текстового файла:

Управляющие символы #13 и #10 (возвращение каретки – ввод следующих символов начнется из первой позиции, и перевод строки – ввод начнется с пустой строки.).

Символы #13 и #10 – маркер конца строки .

Пустая строка содержит только символы #13 и #10 .

В конце файла стоит признак конца файла – управляющий символ #26 (маркер конца файла ).

Пустой текстовый файл содержит один символ #26.

При записи чисел, строк и логических значений они превращаются в символьный (текстовый) вид.

При чтении чисел и строк они автоматически превращаются из текстового представления в машинное.

Для работы с текстовым файлом необходимо определить файловую переменную:

Если файл открыт для записи (процедура Rewrite) – разрешена только запись данных.

Если файл открыт для чтения (процедура Reset) – разрешено только чтение.

Считывание данных из текстового файла осуществляется процедурами Read и Readln:

Read

Readln (файловая_переменная, список_ввода);

список_ввода – перечень переменных символьного, строкового, целого и действительного типов.

Сложные структурированные типы (такие, как массивы, множества, записи и др.) могут быть введенны только по элементам (по полям записей).

После считывания определенного компонента файловый указатель сдвигается к следующему компоненту.


Если выполняется считывание файла в переменную типа char, то процедура Read считывает один символ. Когда достигнут конец строки, результатом считывания являются символы конца строки, #13 и #10, а когда достигнут конец файла, считывается символ конца файла, #26.

Во время считывания значения в переменную целого или действительного типа сначала выделяется подстрока, в которой удалены все ведущие пробелы, символы табуляции (#9) и маркеры конца строки.

Считывания прекращается при обнаружении первого пробела, маркера конца строки или символа табуляции.

Считанная строка цифровых символов превращается в число, которое присваивается соответствующей переменной.

Следующая операция считывания начинается с пробела (маркера конца строки, символа табуляции и т.п.).

Если выделенная подстрока содержит нецифровые символы, то возникает ошибка ввода-вывода.

Во время считывания данных в переменную типа string процедура Read считывает все символы до маркера конца строки.

Если количество символов строки в файле больше количества, указанного в объявлении строковой переменной, то лишние символы не считываются.

Если процедурой Read определенную строку прочитали полностью, то во время следующего ее вызова считывание начинается с маркера конца строки, а значит, будет считана строка нулевой длины.

Процедура Read не переводит файловый указатель на следующую строку символов и потому ее нельзя использовать для считывания последовательности строк.

Процедура Readln считывает все символы строки с символом его конца включительно, что обеспечивает перевод файлового указателя на новую строку.

Процедуру можно вызвать без списка ввода, которая вызовет перевод файлового указателя на начало следующей строки файла без считывания предыдущей строки.

Применяя процедуру Readln для считывания чисел, следует учитывать, что после считывания последней цифры числа все символы текста, которые остались до маркера конца строки, будут пропущены, и доступным станет первый символ следующей строки текстового файла.


Запись в текстовый файл осуществляется с помощью процедур Write и Writeln :

Write

Writeln (файловая_переменная, список_вывода);

Здесь файловая_переменная – переменная типа text;

список_вывода – перечень переменных или выражений символьного, строкового, целого, действительного или логического типа.

Различие между процедурами Write и Writeln заключается в том, что строка, которая записывается в файл с помощью процедуры Writeln, завершается символом конца строки.

Если процедура Writeln используется без списка вывода, то в файл записывается пустая строка.

Для считывания из текстового файла всех данных нужно использовать функцию Eof, которая определяет, достигнут ли конец файла. Синтаксис вызова этой функции.

Eof (файловая_переменная);

Она возвращает значение булевого типа. Если файловый указатель находится за последним элементом файла, или если файл пустой функция возвращает значение True. Иначе она возвращает значение False.

В которых содержатся данные, не рассчитанные на интерпретацию в качестве текстовых (например, файлы, хранящие текст в закодированном или сжатом виде, или хранящие не текст, а звук, изображение или иные данные).

Текстовый файл

MIME-тип text/plain
Противоположно двоичный файл
Расширение файла .txt или .text
Медиафайлы на Викискладе

В отличие от термина «текстовые данные» (текстовый формат данных), характеризующего содержимое данных, термин «текстовый файл» относится к файлу и характеризует его как контейнер, хранящий такие данные.

Описание

Текстовый файл содержит последовательность символов (в основном печатных знаков , принадлежащих тому или иному набору символов). Эти символы обычно сгруппированы в строки (англ. lines, rows ). В современных системах строки разделяются разделителями строк , в прошлом же применялось хранение строк в виде записей постоянной или переменной длины (см.: Перфокарта). Иногда конец текстового файла (особенно если в файловой системе не хранится информация о размере файла) также отмечается одним или более специальными знаками, известными как маркеры конца файла .

Преимущества и недостатки

Преимущества:

  • Универсальность - текстовый файл может быть прочитан (так или иначе) на любой системе или ОС , особенно если речь идёт об однобайтных кодировках вроде ASCII , которые не подвержены проблеме, характерной для других форматов файлов - для них не важна разница в порядке байтов или длине машинного слова на разных платформах .
  • Устойчивость - каждое слово и символ в таком файле самодостаточны и, если случится повреждение байтов в таком файле, то обычно можно восстановить данные или продолжить обработку остального содержимого, в то время как у сжатых или двоичных файлов повреждение нескольких байтов может сделать файл совершенно невосстановимым. Многие системы управления версиями рассчитаны на текстовые файлы и с двоичными файлами могут работать только как с единым целым.
  • Формат текстового файла крайне прост и его можно изменять текстовым редактором - программой, входящей в комплект практически любой ОС .

Недостатки:

  • У больших несжатых текстовых файлов низкая информационная энтропия - эти файлы занимают больше места, нежели минимально необходимо. Хотя эта избыточность и определяет повышенную устойчивость к сбоям в каналах передачи данных и при получении данных с носителей , например, с магнитной ленты .
  • Некоторые операции с текстовыми файлами неэффективны. Например, если в файле встретится число, вычислительная система до начала операций с ним должна будет перевести его в свой внутренний формат, применив сравнительно сложную процедуру конвертации числа; чтобы перейти на 1000-ю строку, требуется считать 999 строк, идущих до неё; сложно заменить одну строку другой и т. д. Поэтому при работе с большими объёмами данных текстовые файлы применяют только как промежуточный формат, обеспечивающий интероперабельность .

Форматы, основанные на текстовых файлах

В силу своей простоты текстовые файлы нередко используются для хранения служебной информации (например, логов): так как операция добавления в конец текстового файла новых данных не требует сколь-нибудь значительных вычислительных ресурсов независимо от уже имеющегося объёма файла и вида добавляемых текстовых данных, ведение текстовых лог-файлов обычно происходит эффективно и незаметно для пользователя и для других приложений (вплоть до исчерпания дискового пространства).

Текстовый формат служит основой для многих более специализированных форматов (например, .ini , SGML , HTML , XML , TeX , исходных текстов языков программирования). В некоторых из таких форматов определённые сочетания символов могут использоваться как средства разметки текста. В таком случае файл может хранить форматированный текст, в котором для символов дополнительно может быть задан шрифт, начертание, размер и т. п. (например, Rich Text Format , HTML).

Расширения имён файлов

В DOS ,Mac os и Windows для файлов с неформатированным текстом обычно используется расширение .txt . Тем не менее, текстовыми могут являться файлы с любым другим расширением или без оного. Например, исходные коды программ обычно хранятся в файлах с расширениями, соответствующими языку программирования , на котором написаны программы (.java , .bas , .pas , .c).

Форматированный текст (текст с разметкой) обычно хранится в файлах с расширением, соответствующим формату или языку разметки - .rtf , .htm , .html .

Кодировки

8-битный текст

Исторически для кодирования текстовых файлов применялись 7-битный набор символов ASCII , а также 8-битные EBCDIC и различные расширения ASCII. В 8-битных кодовых страницах общепринято использовать в первой половине кодовой таблицы символы, соответствующие ASCII.

Преимуществом 8-битного представления текста является программная простота и независимость от проблемы порядка байтов или длины машинного слова на разных платформах. Недостаток - большое количество различных стандартов, что может приводить к несовместимости.

Unicode в текстовых файлах

Применение Unicode в текстовых файлах хотя в основном решает «проблему кодировок» и стандартизирует употребление управляющих символов, но создаёт свои проблемы. В большинстве современных систем неделимой единицей информации в потоке данных является табуляция (код 9) и перевод страницы (код 0xC). Последний использовался старыми текстовыми редакторами наподобие ЛЕКСИКОН , а также в файлах, предназначенных для распечатки на принтере.

Текстовые файлы

Текстовые файлы предназначены для хранения текстовой информации. Именно в таких файлах хранятся, например, исходные тексты программ. Компоненты текстовых файлов могут иметь переменную длину, что существенно влияет на характер работы с ними. Доступ к каждой строке текстового файла Паскаля возможен лишь последовательно, начиная с первой. К текстовым файлам применимы процедуры assign, reset, rewrite, read, write и функция eof. При создании текстового файла в конце каждой записи (строки) ставится специальный признак EOLN(end of line – конец строки). Для определения достижения конца строки существует одноименная логическая функция EOLN(<имя_ф_переменной>), которая принимает значение true, если конец строки достигнут.

Кроме процедур read и write при работе с текстовыми файлами используются их разновидности readln и writeln. Отличие заключается в том, что процедура writeln после записи заданного списка записывает в файл специальный маркер конца строки. Этот признак воспринимается как переход к новой строке. Процедура readln после считывания заданного списка ищет в файле следующий признак конца строки и подготавливается к чтению с начала следующей строки.

Пример решения задачи с файлами

Пусть нам необходимо сформировать текстовый файл, а затем переписать из данного файла во второй только те строки, которые начинаются с буквы «А» или «а».

Решение: нам понадобятся две файловые переменные f1 и f2, поскольку оба файла текстовые, то тип переменных будет text. Задача разбивается на два этапа: первый – формирование первого файла; второй – чтение первого файла и формирование второго, затем вывод на экран содержимого второго файла.

Program primer;

Var f1,f2:text;

I,n: integer;

S: string;

Begin

{формируем первый файл}

Assign(f1, ‘file1.txt’); {устанавливаем связь файловой переменной с физическим файлом на диске}

Rewrite(f1); {открываем файл для записи}

Readln(n) {определим количество вводимых строк}

for i:=1 to n do

begin

readln(s); {вводим с клавиатуры строки}

writeln(f1,s); {записываем последовательно строки в файл}

end;

close(f1); {заканчиваем работу с первым файлом, теперь на диске существует файл с именем file1.txt, содержащий введенные нами строки. На этом программу можно закончить, работу с файлом можно продолжить в другой программе, в другое время, но мы продолжим}

{часть вторая: чтение из первого файла и формирование второго}

Reset(f1); {открываем первый файл для чтения}

Assign(f2, ‘file2.txt’); {устанавливаем связь второй файловой переменной с физическим файлом}

Rewrite(f2); {открываем второй файл для записи}

{Дальше необходимо последовательно считывать строки из первого файла, проверять выполнение условия и записывать нужные строки во второй файл. Для чтения из текстового файла рекомендуется использовать цикл по условию «пока не конец файла»}

While not eof(f1) do

Begin

Readln(f1,s);{считываем очередную строку из первого файла}

If (s=’A’) or (s=’a’) then

Writeln(f2,s); {записываем во второй файл строки, удовлетворяющие условию}

End;

Close(f1,f2); {заканчиваем работу с файлами}

{часть третья: выводим на экран второй файл}

Writeln;

Writeln(‘Второй файл содержит строки:’);

Reset(f2); {открываем второй файл для чтения}

While not eof(f2) do {пока не конец второго файла}

Begin

Readln(f2,s);{считываем очередную строку из второго файла}

Writeln(s); {выводим строку на экран}

End;

End.

Задача 1: Дан текстовый файл. Посчитать количество строк в файле.

  1. Открыть файл для чтения;
  2. Организовать считывание данных из файла построчно (readln(f,s), где s-переменная типа string), насчитывая на каждом шаге считывания значение переменной-счетчика k;
  3. Вывести на экран значение переменной-счетчика;
  4. Закрыть файл.

program z1;

var k:integer;

s:string;

f:text;

begin

assign(f,"input.pas");

reset(f);

k:=0;

while not eof(f) do begin

readln(f,s); k:=k+1;end;

writeln("k=",k);

close(f);

end.

Задача 2: Дан текстовый файл. Напечатать все его строки, начинающиеся с символа «Т».

Составим алгоритм решения задачи (Создать текстовый файл данных – input.pas до начала решения задачи):

  1. Связать логический файл f с физическим файлом input.pas;
  2. Открыть файл для чтения;
  3. Организовать считывание данных из файла построчно (readln(f,s), где s-переменная типа string), проверяя на каждом шаге, удовлетворяет ли строка условию: первый символ равен «Т», и если да, то вывести эту строку на экран;
  4. Закрыть файл.

program z2;

var k:integer;

s:string;

f:text;

begin

assign(f,"input.pas");

reset(f);

while not eof(f) do begin

readln(f,s);

if s=’T’ then writeln(s);

end;

close(f);

end.

Задача 3: Дан текстовый файл. Напечатать все его строки, содержащие более 30 символов.

Составим алгоритм решения задачи (Создать текстовый файл данных – input.pas до начала решения задачи):

  1. Связать логический файл f с физическим файлом input.pas;
  2. Открыть файл для чтения;
  3. Организовать считывание данных из файла построчно (readln(f,s), где s-переменная типа string), проверяя на каждом шаге, удовлетворяет ли строка условию: длина строки больше 30, и если да, то вывести эту строку на экран;
  4. Закрыть файл.

program z3;

var k:integer;

s:string;

f:text;

begin

assign(f,"input.pas");

reset(f);

while not eof(f) do begin

readln(f,s);

if length(s)>=30 then writeln(s);

end;

close(f);

end.

Задача 4: Дан текстовый файл. Напечатать все его строки, содержащие в качестве фрагмента заданный текст.

Составим алгоритм решения задачи (Создать текстовый файл данных – input.pas до начала решения задачи):

  1. Связать логический файл f с физическим файлом input.pas;
  2. Открыть файл для чтения;
  3. Задать фрагмент текста для поиска (s1);
  4. Организовать считывание данных из файла построчно (readln(f,s), где s-переменная типа string), проверяя на каждом шаге, удовлетворяет ли строка условию: в ней содержится в качестве фрагмента заданный текст (s1), и если да, то вывести эту строку на экран;
  5. Закрыть файл.

program z4;

var k:integer;

s1,s:string;

f:text;

begin

writeln(‘введи фрагмент текста ’);

readln(s1);

assign(f,"input.pas");

reset(f);

while not eof(f) do begin

readln(f,s);

if pos(s1,s)<>0 then writeln(s);

end;

close(f);

end.

Задача 5: Дан текстовый файл. Напечатать 5 строку в новый текстовый файл, а остальные на экран.

Составим алгоритм решения задачи (Создать текстовый файл данных – input.pas до начала решения задачи):

  1. Связать логический файл f с физическим файлом input.pas, а логический файл g с физическим файлом output.pas;
  2. Открыть файл для чтения;
  3. Организовать считывание данных из файла построчно (readln(f,s), где s-переменная типа string), насчитывая на каждом шаге считывания значение переменной-счетчика k, и, проверяя на каждом шаге, равно ли значение счетчика 5, и если да, то вывести эту строку в файл g, иначе вывести на экран;
  4. Закрыть файл.

program z5;

var k:integer;

s:string;

f,g:text;

begin

assign(f,"input.pas");

reset(f);

assign(g,"output.pas");

rewrite(g);

k:=0;

while not eof(f) do begin

readln(f,s);k:=k+1;

if k=5 then writeln(g,s);

end;

close(f); close(f);

Принадлежащих тому или иному набору символов). Это символы обычно сгруппированы в строки (англ. lines, rows ). В современных системах строки разделяются разделителями строк , в прошлом же применялось хранение строк в виде записей постоянной или переменной длины (см.: Перфокарта). Иногда конец текстового файла (особенно если в файловой системе не хранится информация о размере файла) также отмечается одним или более специальными знаками, известными как маркеры конца файла .

Текстовой файл может содержать как форматированный , так и неформатированный текст.

Преимущества и недостатки

Преимущества:

  • Универсальность - текстовый файл может быть прочитан (так или иначе) на любой системе или ОС , особенно если речь идёт об однобайтных кодировках вроде ASCII , которые не подвержены проблеме, характерной для других форматов файлов - для них не важна разница в порядке байтов или длине машинного слова на разных платформах .
  • Устойчивость - каждое слово и символ в таком файле самодостаточны и, если случится повреждение байтов в таком файле, то обычно легче восстановить данные и продолжить обработку остального содержимого, в то время как у сжатых или двоичных файлов повреждении нескольких байтов может привести к невозможности восстановить всё содержимое файла. Многие системы управления версиями рассчитаны на текстовые файлы и с двоичными файлами могут работать только как с единым целым.
  • Формат текстового файла крайне прост и его можно изменять текстовым редактором - программой, входящей в комплект практически любой ОС .

Недостатки:

  • У больших несжатых текстовых файлов низкая информационная энтропия - эти файлы занимают больше места, нежели минимально необходимо. Хотя эта избыточность и определяет повышенную устойчивость к сбоям в каналах передачи данных и при получении данных с носителей , например, с магнитной ленты .
  • Некоторые операции с текстовыми файлами неэффективны. Например, если в файле встретится число, вычислительная система до начала операций с ним должна будет перевести его в свой внутренний формат, применив сравнительно сложную процедуру конвертации числа; чтобы перейти на 1000-ю строку, требуется считать 999 строк, идущих до неё; сложно заменить одну строку другой и т. д. Поэтому при работе с большими объёмами данных текстовые файлы применяют только как промежуточный формат, обеспечивающий интероперабельность .

Форматы, основанные на текстовых файлах

В силу своей простоты текстовые файлы нередко используются для хранения служебной информации (например, логов). Текстовый формат служит основой для многих более специализированных форматов (например, .ini , SGML , HTML , XML , TeX , исходных текстов языков программирования).

В текстовом файле текст может храниться как в неформатированном, так и форматированном или размеченном виде (например, Rich Text Format , HTML), где к каждому символу может быть применено форматирование (шрифт, начертание, размер и т. п.).

Расширения имён файлов

Unicode в текстовых файлах

Применение Unicode в текстовых файлах хотя в основном решает «проблему кодировок» и стандартизирует употребление управляющих символов, но создаёт свои проблемы. В большинстве современных систем неделимой единицей информации в потоке данных является байт (8 бит) , которых для кодирования одного символа из Юникода требуется несколько. В качестве решения применяются несовместимые между собой системы UTF-8 и две версии UTF-16 (UTF-16LE и UTF-16BE с противоположным порядком байтов). Иногда в начало файла добавляют специальный символ-маркер (U+FEFF ), позволяющий распознать формат однозначно. UTF-8 имеет преимущество обратной совместимости с ASCII, однако программная обработка текста в UTF-8 усложняется непостоянным размером символа. Также, тексты в Юникоде отличаются ещё большей избыточностью , нежели 8-битные.

Управляющие символы

Различные операционные системы придерживаются своего представления перевода строки и конца файла. В UNIX перевод строки состоит из одного символа LF (код 10), в Mac OS - из символа CR (код 13), а в DOS и Windows перевод строки кодируется последовательностью двух символов: CR и LF.

Помимо названных, в текстовых файлах применяются такие символы, как табуляция (код 9) и перевод страницы (код 12).

См. также

  • Текст как изображение

Примечания


Wikimedia Foundation . 2010 .

  • Библейские имена
  • Движение за права сексуальных и гендерных меньшинств

Смотреть что такое "Текстовый файл" в других словарях:

    текстовый файл - Файл, содержащий строки написанной информации, которую можно непосредственно вывести на экран дисплея или принтер, используя обычные команды операционной системы. Файлы, создаваемые текстовыми процессорами не являются текстовыми, т.к. содержат… …

    Файл (компьютер) - Файл (англ. file папка, скоросшиватель) концепция в вычислительной технике: сущность, позволяющая получить доступ к какому либо ресурсу вычислительной системы и обладающая рядом признаков: фиксированное имя (последовательность символов, число или … Википедия

    ТЕКСТОВЫЙ ПРОЦЕССОР - (текстовый редактор), компьютерная система, предназначенная для создания и обработки текста. Если система может применяться только для этой цели, тогда она называется специализированным текстовым процессором. Более распространен персональный… … Научно-технический энциклопедический словарь

    файл ASCII - Текстовый файл, содержащий только символы с кодами до 127 (набор символов семибитовой кодировки ASCII). Такой файл не содержит символы национальных алфавитов и символы псевдографики. Тематики информационные технологииСправочник технического переводчика

    файл определения - Специальный текстовый файл, содержащий директивы, используемые для связывания объектных составляющих программ (или библиотеки) в выполняемый файл. [Е.С.Алексеев, А.А.Мячев. Англо русский толковый словарь по системотехнике ЭВМ. Москва 1993]… … Справочник технического переводчика

    файл инициализации - Специальный текстовый файл, используемый при загрузке среды и отдельных программ для начальной установки параметров. [Е.С.Алексеев, А.А.Мячев. Англо русский толковый словарь по системотехнике ЭВМ. Москва 1993] Тематики информационные технологии в … Справочник технического переводчика

    Файл - У этого термина существуют и другие значения, см. Файл (значения). Файл (англ. file) блок информации на внешнем запоминающем устройстве компьютера, имеющий определённое логическое представление (начиная от простой последовательности… … Википедия

    файл - сущ., м., употр. сравн. часто Морфология: (нет) чего? файла, нет? файлу, (вижу) что? файл, чем? файлом, о чём? о файле; мн. что? файлы, (нет) чего? файлов, чем? файлам, (вижу) что? файлы, чем? файлами, о чём? о файлах 1. Файлом называется массив… … Толковый словарь Дмитриева

    Файл конфигурации - или конфигурационный файл используется для хранения настроек компьютерных программ, в том числе и операционных систем. Как правило, конфигурационные файлы имеют текстовый формат и могут быть прочитаны и отредактированы пользователем программы.… … Википедия

    файл со словами, разделенными для переноса - Файл, содержащий текстовый документ, в словах которого расставлены переносы с помощью специальной функции расстановки. Тематики информационные технологии в целом EN hyphenation file … Справочник технического переводчика

Книги

  • Портфолио первоклассника. Программа внеурочной деятельности. Методическое пособие (+CD) , Умнова Марина Сергеевна , Данная рабочая программа предназначена для организации работы с портфолио обучающихся 1 класса в рамках внеурочной деятельности. Программа разработана и составлена с учетом Федерального… Категория: Учебно-воспитательная работа в школе Серия: Классное руководство Издатель:


Загрузка...
Top