Имена файлов и их расширения

Имя файла состоит из двух частей: собственно имени и его расширения. Друг от друга они отделяются точкой. Расширение облегчает работу операционной системе, явно указывая на то, что должно содержаться в файле. Вместе с тем, это таит в себе определенную опасность: если случайно или намеренно изменить имя файла, станет неочевидно, с помощью какой программы его открывать.

Для символов, используемых для названия файлов, существует целый ряд ограничений.

Маски в именах файлов

Для некоторых видов работ с файлами (групповых операций или поиска) используется маска, содержащая символы подстановки «*» и «?».

Символ «?» в маске означает, что вместо него должен стоять любой символ.

Символ «*» в маске означает, что вместо него может быть подставлено любое сочетание символов. То есть их может не быть совсем, либо быть несколько (1, 2, 3 и т.д.).

Для ясности разберем несколько примеров.

Во многих случаях маской по умолчанию является вариант «*.*». В этом случае и имя файла и его расширение может принимать любые значения, а действие команды с такой маской распространяется на все файлы без исключения.

Маска «*.?*» очень похожа на предыдущую, но означает, что расширение должно содержать хотя бы одну букву. Иначе говоря, файлы (и/или папки) не имеющие расширения будут проигнорированы.

Маска «*.doc» относится к файлам с расширением «doc», то есть файлам Word версии 2003 и ранее.

Маска «*.doc?» найдет файлы Word 2007.

Маска «*.doc*» найдет файлы любой версии Word: с трех- и четырехбуквенным расширением.

Маска «*.??» обнаружит только файлы, имеющие расширение ровно в две буквы.

Маска «???.*» выделит все файлы с трехбуквенными именами.

Маска «mark*.doc*» найдет файлы любой версии Word, начинающиеся с «mark».

Ограничения в некоторых особых случаях

MS-DOS (FAT16). Имя файла составляется по правилу 8+3 (ISO 9660): имя не может превышать восьми символов, а расширение – трех. Для имен файлов крайне нежелательно использовать кирилические буквы, так как множество вспомогательных программ для работы с файловой системой их просто не понимает. Впрочем это касается всех нелокализованных операционных систем. Точка может использоваться только для отделения имени от расширения, в связи с чем ее нельзя никак использовать в имени файла. Запрещено использование пробела.
Число вложений папок не может превышать восьми.

Windows (VFAT, FAT32, NTFS). Файл может иметь имя длиной до 255 символов. Теоретически сюда включается и длина пути, но максимальная его длина может достигать 32767 символов (32 кб или 215).
Число вложений папок не может превышать 128.

CD. Наиболее распространенными форматами, описывающими метод хранения файлов на CD, являются расширенный ISO 9660 (длина до 31 символа) и Microsoft Joliet Extension к ISO9660 (до 34 символов).

Unix (NFS, Network File System) Принципиальное значение имеет регистр символов. «xx.txt» и «xX.txt» – два совершенно разных имени, и в одной папке могут находиться оба этих файла. Это может несколько сбить с толку пользователей Windows.
Имя отдельного каталога не должно превышать 255 символов и начинаться с буквы либо с символа подчеркивания и состоять из букв, цифр, (_.,), но не содержать пробелов. Расширение совершенно не является необходимым.
Абсолютный путь к файлу (вместе с его именем) не должен превышать 1023 символа.

Достаточно сложно дать однозначную оценку использованию национальных алфавитов для названий файлов. В целом можно говорить о недопустимости их использования. Это связано с тем, что такие ситуации неизвестны большинству утилит восстановления файловой системы. Для избежаниия проблем рекомендуется использовать транслитерацию.

В операционных системах предыдущего поколения (например DOS), расширение не могло превышать трех символов. В настоящее время таких ограничений нет. Более того, для некоторых случаев предпочтительным является использование четырехсимвольных вариантов (jpeg, html). На самом же деле расширение может состоять из двух (.ps) или даже одного символа (.h). Некоторые операционные системы (Unix, MacOS) могут вообще обходиться без расширения за счет того, что при открытии файла считывается его заголовок.

Исполняемые (исполнимые) файлы

Расширение Пояснения
.exe От англ. executable – исполняемый
.com От англ. command – командный
.cmd
.bat От англ. batch – пакетный файл
.vbs От англ. Visual Basic Script
.msi От англ. MicroSoft Installer

Текстовые форматы

Расширение Пояснения
.txt Простой текстовый документ, чаще всего в 8-разрядной кодировке ANSI или ASCII
.doc Как правило, файлы в формате Microsoft Word
.dot Шаблон Microsoft Word
.docx Microsoft Word2007
.docm Microsoft Word2007 с включенными макросами
.rtf Microsoft Reach Text Format. Теговый язык форматирования текста, являющийся универсальным способом для переноса текстовой информации из одной программ в другую
.wp WordPerfect
.wps Works
.fb2 FictionBook. Формат для чтения книг с экрана, в том числе КПК

Графические форматы

Расширение Пояснения
Растровые
.ani Animated Cursor
.bmp BitMaP. Формат, фактически пригодный только для просмотра на экране с локального ресурса
.cur Cursor
.dib Device Independent Bitmap
.gif, .gfa Graphics Interchange Format
.ico Icon (пиктограмма)
.img &Digital Research GEM Bitmap
.jpg, .jpeg, .jpe, .jfif Joint Picture Motion Group (JPEG File Interchange Format)
.png Portable Networks Graphics
.pcd Photo CD
.pcx Z-Soft PaintBrush
.tga TrueVision Targa
.tif, .tiff Toggle Immage File Format
Векторные
.cgm Computer Graphics Metafile
.emf Windows Enhanced Metafile
.dxf Drawing Interchange Format
.eps Encapsulate PostScript
.gem  
.ps Файл на языке PostScript, служащем для управления специальными устройствами вывода. Является ключевым для полиграфического воспроизводства документов. Фактически может совмещать текст и графику любого вида.
.vsd Microsoft Visio
.wmf Формат Windows MetaFile, используемый ОС Windows для переноса векторных изображений через буфер памяти
.wpg Word Perfect Graphic
.hpg, .hpgl Векторная графика на языке HPGL для графопостроителя (Hewlett-Packard Graphic Language)
Программные
.ai Adobe Illustrator
.ccx Corel Binary Meta File
.cdr Corel Draw
.psd, .pdd Adobe Photoshop

Базы данных (БД)

Расширение Пояснения
.cdx Комплексный индекс
.idx Индивидуальный индекс
.db БД Paragox
.dbc БД FoxPro
.dbt Файл примечаний
.dbf Таблицы БД dBase, FoxBase, FoxPro
.mdb БД Access
.tbk Резервная копия файла примечаний

Архивы

Всего существует свыше 100 расширений имен файлов архивов. Здесь приведены наиболее важные.
Расширение Пояснения
.arj Архив, подготовленный программой WinArj или Arj для DOS
.cab Упакованные файлы дистрибутивного комплекта
.ice Архив ICE
.jar Архив Jar
.lzh, .lha Архив бесплатной программы LHA
.pac Чаще всего – дистрибутив
.rar Архив, подготовленный программой Rar или WinRar. Практически, во многих случаях достигается наибольший коэффициент сжатия, по сравнению с другими форматами. Программы бесплатны для жителей территорий бывшего СССР.
.zip Архив, подготовленный программой WinZip или Zip для DOS. В последнем случае для запаковки используется программа pkzip, а для распаковки – pkUNzip. Формат для DOS является абсолютным стандартом архивов в Интернете, благодаря тому, что может быть открыт практически любой программой.
.zoo Архив ZOO

Электронные таблицы

Расширение Пояснения
.xls Таблица Excel
.xlk Резервная копия таблицы Excel
.xlt Шаблон Excel
.wk1, .wk3, .wk4, .wks Разные версии Lotus 1-2-3
.wq1 Quattro Pro

Звуковые файлы

Расширение Пояснения
.mp3  
.wav  

Видеофайлы

Расширение Пояснения
.avi  
.flv Flash Video
.mpg, .mpeg  

Специальные файлы в среде Windows и др.

Расширение Пояснения
.tmp, .temp Временный файл
.ini Файл настроек программы или ОС
.bak Резервная копия документа в большинстве программ
.wbk Резервная копия документа в MS Word
.reg  

Языки программирования

Расширение Пояснения
.c Программа на языке C
.vb Программа на языке Visual Basic
.vbs Программа на языке Visual Basic Script
.js Программа на языке Java Script
.h Файл вставок (заголовков, header) на языке Cи

Web-страницы и т.п.

Расширение Пояснения
.htm, .html Гипертекстовый документ (Hypertext Markup Language, HTML)
.mht Mime HTML
.xml  

Полезные ссылки

Справочник типов файлов