Plik binarny

Podgląd pliku binarnego w edytorze heksadecymalnym

Plik binarny – plik o dowolnej zawartości, oznacza wszystkie pliki poza plikami tekstowymi zawierającymi tekst zapisany w ustalonym sposobie kodowania znaków drukarskich, wraz z kodami sterującymi, w tym także kod znaku końca pliku – ^Z.

Pojęcie pliku tekstowego, wprowadzono w początkach rozwoju technik komputerowych, gdy komputery współpracowały z tekstowymi urządzeniami do pobierania i drukowania tekstów takimi jak dalekopisy, drukarki tekstowe, czytniki kart dziurkowanych.

Niemal wszystkie języki wysokiego poziomu mają oddzielne mechanizmy do obsługi plików tekstowych i binarnych.

Systemy operacyjne, podczas operacji na plikach, nie rozróżniają plików tekstowych i binarnych np. Unix. W DOS i Windows, wykonując niektóre operacje na plikach np. kopiowanie lub łączenie plików (copy, xcopy), porównywanie plików (fc) inaczej traktuje pliki tekstowe i binarne. DOS domyślnie traktuje plik jako plik tekstowy, a po napotkaniu w nim kodu sterującego ^Z, uznaje że to jest koniec pliku, nie wysyła pozostałej części do drukarki. W niektórych poleceniach DOS, dokonujących operacji na zawartości pliku, istnieje możliwość deklarowania, że dany plik jest plikiem binarnym (/b). W przypadku braku określenia typu pliku System Windows próbuje rozpoznać czy wybrany plik jest plikiem tekstowym.

Struktura

Pliki binarne tworzone przez programy mogą mieć wewnętrzną strukturę, której naruszenie sprawia, że plik stanie się niepoprawny dla programów je obsługujących.

Pliki binarne to w gruncie rzeczy ciągi bajtów, czyli grup ośmiu bitów. W przeciwieństwie do plików tekstowych, zawartość plików binarnych nie jest przeznaczona do bezpośredniego odczytu przez człowieka. Klasycznym przykładem są skompilowane programy komputerowe, które programiści często po prostu nazywają "binarkami" (z ang. binaries). Termin "plik binarny" może odnosić się do dowolnego typu pliku zawierającego dane w formacie innym niż czysty tekst. Oznacza to, że pliki binarne mogą przechowywać praktycznie każdy rodzaj informacji cyfrowej, od prostych danych po złożone struktury wykorzystywane przez aplikacje komputerowe.

Niektóre pliki binarne zawierają nagłówki, czyli bloki metadanych wykorzystywane przez programy komputerowe do interpretacji danych zawartych w pliku. Nagłówek często zawiera sygnaturę lub tak zwaną liczbę magiczną, która pozwala zidentyfikować format pliku.

Przykładowo, plik GIF może zawierać wiele obrazów, a nagłówki służą do identyfikacji i opisu każdego bloku danych obrazu. Pierwsze bajty nagłówka mogą zawierać tekst taki jak GIF87a lub GIF89a, co pozwala zidentyfikować plik binarny jako plik GIF.

W przypadku gdy plik binarny nie zawiera żadnych nagłówków, może być określany mianem płaskiego pliku binarnego (ang. flat binary file).

Edycja

Plików binarnych nie da się edytować przy pomocy programów do edycji tekstu, programy te zakładają, że plik zawiera tekst i interpretują dane będące kodami sterującymi. Plik danego typu zwykle może być edytowany tylko przez programy obsługujące jego format pliku. Przy braku odpowiedniego programu, pliki binarne można edytować za pomocą edytora heksadecymalnego, który prezentuje zawartość pliku w postaci ich kodów szesnastkowych, czasami też dziesiętnie oraz tekstu ASCII, oraz umożliwia edycję poszczególnych bajtów pliku.

Rozszerzenia

Typowe rozszerzenia nazwy plików binarnych:[1]

Przypisy

  1. what-are-binary-and-text-files