Le lingue CJK sono lingue sillabiche. Ogni sillaba occupa due byte nella memoria del computer. Non esiste alcun concetto di singola lettera nelle lingue CJK.
Le lingue cinese, giapponese e coreana (CJK) sono basate su caratteri, dove ogni carattere rappresenta un'idea, anziché una forma specifica del carattere o un oggetto. Poiché i loro caratteri sono più complessi e grafici rispetto alle lettere dell'alfabeto romano, richiedono tipicamente il doppio della memoria e sono considerate lingue a doppio byte.
La complessità delle lingue a doppio byte pone questioni relative alle dimensioni dei file, alla compatibilità dei sistemi operativi e del software, nonché alla chiarezza e leggibilità del testo a causa delle opzioni di caratteri più limitate. Inoltre, poiché il testo dei caratteri è basato su semantica, una frase non può essere semplicemente divisa in punti casuali.