Pengkodean informasi teks di komputer

Anonim

Komputer - perangkat kompleks yang dengannya Anda dapat membuat, mengonversi, dan menyimpan informasi. Namun, komputer tidak bekerja dengan cara yang tidak sepenuhnya jelas bagi kami - data grafis, tekstual dan numerik disimpan dalam bentuk array biner.

angka Pada artikel ini, kita akan melihat bagaimana informasi teks dikodekan.

Apa teks untuk kita, untuk komputer - urutan karakter. Setiap karakter adalah kumpulan nol dan satu yang spesifik. Simbol berarti tidak hanya huruf kecil dan kecil dari alfabet Latin, tetapi juga tanda baca, tanda aritmatika, simbol layanan, simbol khusus, dan bahkan spasi.

Pengkodean biner dari informasi tekstual

Ketika Anda menekan tombol tertentu, sinyal listrik dikirim ke pengontrol internal, yang dikonversi menjadi kode biner. Kode dipetakan ke karakter tertentu, yang ditampilkan di layar. Untuk mewakili alfabet Latin dalam format digital, sistem pengkodean ASCII internasional dibuat. Dibutuhkan 1 byte untuk merekam satu karakter, oleh karena itu, karakter terdiri dari urutan nol dan nol. Interval perekaman adalah dari 00000000 hingga 11111111, yaitu, pengkodean informasi teks menggunakan sistem ini memungkinkan Anda untuk mewakili 256 karakter. Dalam kebanyakan kasus, ini sudah cukup.

ASCII dibagi menjadi dua bagian. 127 karakter pertama (dari 00000000 hingga 01111111) bersifat internasional dan mewakili karakter dan huruf tertentu dari alfabet Inggris. Bagian kedua, ekstensi (dari 10.000.000 ke 1.111.111), dimaksudkan untuk mewakili alfabet nasional, yang tulisannya berbeda dari yang Latin.

Pengkodean informasi tekstual dalam ASCII didasarkan pada prinsip peningkatan urutan, yaitu, semakin tinggi nomor urut huruf Latin, semakin besar nilai kode ASCII-nya. Angka-angka dan bagian Rusia dari tabel dibangun di atas prinsip yang sama.

Namun, di dunia ada beberapa jenis penyandian untuk huruf Cyrillic. Yang paling umum adalah KOI-8 (pengodean delapan-bit, yang sudah digunakan pada tahun 70-an pada sistem operasi root pertama yang tidakix), ISO 8859-5 (dikembangkan oleh Biro Standardisasi Internasional), СР 1251 (pengodean teks yang digunakan dalam

Windows modern), serta Unicode pengodean 2-byte, yang dengannya Anda dapat mengirimkan 65536 karakter. Variasi pengkodean seperti ini disebabkan oleh fakta bahwa semuanya dikembangkan pada waktu yang berbeda, untuk sistem operasi yang berbeda dan karena berbagai alasan. Karena hal ini, seringkali ada kesulitan dalam mentransfer teks dari satu media ke media lain - jika penyandian tidak cocok, pengguna hanya akan melihat satu set ikon yang tidak dapat dipahami. Bagaimana saya bisa memperbaiki situasi ini? Di Word, misalnya, saat Anda membuka dokumen, Anda menerima pesan tentang masalah dengan tampilan teks dan menawarkan beberapa opsi untuk transcoding.

Jadi, pengkodean dan pemrosesan informasi tekstual di kedalaman komputer adalah proses yang agak rumit dan memakan waktu. Semua karakter alfabet apa pun hanya mewakili urutan angka tertentu dari sistem biner, satu sel adalah satu byte informasi.

Pesan Populer

Direkomendasikan