C ++ Τύποι χαρακτήρων - ανδρείκελοι - Προσωπικά Οικονομικά 2024

Βίντεο: Η ΓΛΩΣΣΑ C - ΜΑΘΗΜΑ 10 - ΧΑΡΑΚΤΗΡΕΣ ΚΑΙ ΣΥΜΒΟΛΟΣΕΙΡΕΣ - ΘΕΩΡΙΑ 2 από 2 2024

Η πρότυπη μεταβλητή χαρακτήρων σε C ++ είναι ελάχιστη 1 byte πλάτος και μπορεί να χειριστεί μόνο 255 διαφορετικούς χαρακτήρες. Αυτό είναι αρκετό για τις ευρωπαϊκές γλώσσες, αλλά δεν είναι αρκετά μεγάλο για να χειριστεί γλώσσες που βασίζονται σε σύμβολα όπως το kanji.

Πολλά πρότυπα έχουν δημιουργηθεί για να επεκτείνουν το σύνολο χαρακτήρων για να χειριστούν τις απαιτήσεις αυτών των γλωσσών. Το UTF-8 χρησιμοποιεί ένα συνδυασμό χαρακτήρων 8, 16 και 32 bit για την υλοποίηση σχεδόν κάθε kanji ή ιερογλυφικού που μπορείτε να σκεφτείτε, αλλά εξακολουθείτε να είστε συμβατοί με το απλό ASCII 8-bit. Το UTF-16 χρησιμοποιεί ένα μείγμα χαρακτήρων 16 και 32 bit για την επίτευξη ενός εκτεταμένου συνόλου χαρακτήρων και το UTF-32 χρησιμοποιεί 32 bit για όλους τους χαρακτήρες.

Το UTF αντιπροσωπεύει το Unicode Transformation Format, από το οποίο παίρνει το κοινό ψευδώνυμο Unicode.

Ο πίνακας περιγράφει τους διαφορετικούς τύπους χαρακτήρων που υποστηρίζονται από τη C ++. Αρχικά, η C ++ προσπάθησε να περάσει με έναν αόριστα καθορισμένο ευρύ τύπο χαρακτήρα, wchar_t. Αυτός ο τύπος προοριζόταν να είναι ο ευρύς τύπος χαρακτήρων που είναι εγγενής στο περιβάλλον του προγράμματος εφαρμογής. Το C ++ '11 εισήγαγε ειδικούς τύπους για UTF-16 και UTF-32.

Χαρακτηριστικά ASCII ή UTF-8

Χαρακτηριστικά Χαρακτηριστικά C ++ χαρακτήρων Μεταβλητή Παράδειγμα Χαρακτήρας σε ευρεία μορφή char_16t u'c ' Χαρακτήρας UTF-16 char_32t U'c' Το UTF-16 είναι η τυπική κωδικοποίηση για εφαρμογές Windows. Ο τύπος wchar_t αναφέρεται στο UTF-16 στον κώδικα:: Blocks / gcc compiler.

Οποιοσδήποτε από τους τύπους χαρακτήρων του πίνακα μπορεί να συνδυαστεί και σε συμβολοσειρές:

wchar_t * wideString = L "αυτή είναι μια μεγάλη σειρά";