Zamiana dużych liter na małe i odwrotnie na operacjach bitowych

Jozdowska Edyta · 23 Luty 2020

Kategorie:

programowanie

Tagi:

Unicode
Operacje bitowe
Operator bitowej różnicy symetrycznej
Binarna zamiana znaków
Polskie znaki diakrytyczne
- Demo kodów switchCaseBin i switchCaseAll

Podczas pisania kodu czasem potrzebujemy dokonać zamiany dużych liter na małe lub małych na duże.
W js służą do tego funkcje toUpperCase() i toLowerCase().

Gorzej jak mamy zrobić switcha, czyli duże mają być małe, a małe mają być duże. Ot taką mam fanaberię .

Unicode

Unicode to zestaw znaków zapisanych w odpowiedniej formie. Na teraz, ważna jest jedynie informacja, że oprócz kodu unicode, każda litera z alfabetu ma przypisany swój kod dziesiętny.

TYP	A	B	C	D	E	F	G	H	I	J	K	L
małe	97	98	99	100	101	102	103	104	105	106	107	108
duże	65	66	67	68	69	70	71	72	73	74	75	76

TYP	M	N	O	P	Q	R	S	T	U	V	W	X	Y	Z
małe	109	110	111	112	113	114	115	116	117	118	119	120	121	122
duże	77	78	79	80	81	82	83	84	85	86	87	88	89	90

Zauważmy jedną rzecz. Różnica między 97 a 65 = 32 i tak samo jest dla każdej z liter. Kod dziesiętny małej litery jest większy o dokładnie 32 od kodu dużej litery. No i odwrotnie. Liczba 32 będzie więc dla nas ważnym elementem w naszym kodzie.

Aby uzyskać kod dziesiętny litery w js wykorzystujemy funkcję String.charCodeAt()

"q".charCodeAt() // 113 
"Z".charCodeAt() // 90

Zgadza się z powyższą tabelą? Zgadza się

Operację odwrotną, czyli by uzyskać literę z kodu dziesiętnego przeprowadzamy poprzez String.fromCharCode()

String.fromCharCode(113) // q
String.fromCharCode(90)  // Z

Operacje bitowe

I w tym momencie dochodzimy do operacji bitowych. W praktyce dostępne mamy 6 operacji bitowych:

oznaczenie	operacja
&	mnożenie bitowe/koniunkcja BIT AND
\|	bitowa alternatywa / dodawanie bitowe BIT OR
^	bitowa różnica symetryczna XOR
«	przesunięcie w lewo
»	przesunięcie w prawo
~	uzupełnienie jedynkowe / negacja COMPL

Póki co pozostawię wyjaśnienia każdego z operatorów, bo to grubsza sprawa. Zajmę się tylko tym, który jest nam potrzebny do naszego algorytmu czyli XOR.

Operator bitowej różnicy symetrycznej

Operator bitowej różnicy symetrycznej ( ^ ) sprawdza pojedyncze bity w obu argumentach (bo do tej operacji wymagane są dwa argumenty) i oblicza ich różnicę symetryczną. Jeśli w obu argumentach bity na tej samej pozycji były różne zwraca 1, jeśli były takie same czyli dwa zera albo dwie jedynki zwraca 0. Brzmi jak magia , ale w praktyce jest proste:

				XOR
1	^	0	=	1
0	^	1	=	1
1	^	1	=	0
0	^	0	=	0

Co nam daje ta wiedza? Przyjżyjmy się liczbie 65 odpowiadającej za oznaczenie “A”. Jej zapis w formie binarnej to A = 65 = 01000001 natomiast wspomnianej wcześniej liczby 32 to 32 = 100000
Wykonajmy operację ^ na bitach Tutaj uwaga zaczynamy od prawej strony jak w dzieleniu pisemnym i pozostałe miejsca uzupełniamy zerami, gdyż potrzebujemy taką samą długość, a liczba 32 jest tutaj o dwie pozycje krótsza niż liczba 65 :

65 =	0	1	0	0	0	0	0	1
32 =	0	0	1	0	0	0	0	0
XOR ^	^	^	^	^	^	^	^	^
97 =	0	1	1	0	0	0	0	1

Może nasunąć się jedno pytanie “dlaczego po prostu nie odjąć” lub nie dodać liczby 32. Odpowiedź jest dość prosta. Nie wiemy czy potrzebujemy ją dodać czy odjąć, bo nie mamy zidentyfikowanych czy operację wykonujemy na dużej literze alfabetu czy na małej. Operacja XOR wykonuje obliczenia za nas. W uproszczeniu można stwierdzić, że rozpoznaje za nas jaką operację ma wykonać - to takie abstrakcyjne wyjaśnienie, ale do mnie przemawia

Binarna zamiana znaków

Wyposażeni w odpowiednią wiedzę przystępujemy do układania naszej funkcji:

const switchCaseBin = (n) =>
    n.split``.map((a)=>String.fromCharCode(a.charCodeAt()^32)).join``;

switchCaseBin("aBdEfZfv");
// AbDeFzFV

Dla mnie jest to bardzo eleganckie rozwiązanie, szkoda, że ułomne.

Uwaga!!! Ta funkcja będzie działać prawidłowo tylko dla stringów bez polskich znaków diakrytycznych, czyli dla a-z i A-Z. Usuwa też z ciągu znaków spacje, a to też ważne

Polskie znaki diakrytyczne

Niestety gdy przychodzi do testów, okazuje się, że coś nie zostało uwzględnione. No po to są testy przecież
Gdy musimy wdrożyć kod, by był uniwersalny, musimy wziąć pod uwagę wszystkie możliwości. I tak np. polskie znaki diakrytyczne zaczynają się od 211 “ó” i rosną o 1 dla dużej litery, potem jest skok itp. Czyli powyższe nie ma dla nich zastosowania.

TYP	Ą	Ć	Ę	Ł	Ń	Ó	Ś	Ź	Ż
małe	260	262	280	321	323	211	346	377	379
duże	261	263	281	322	324	243	347	378	380

W tym przypadku, jeśli potrzebujemy więcej musimy przepisać naszą funkcję.
Wpierw sprawdzić z jakim znakiem mamy do czynienia, potem odpowiednio go zamienić.

const switchCaseAll = (n) =>{    
    const checkIsUpper = (m) =>  m.toUpperCase() ==  m; 
    return n.split``.map((a) => checkIsUpper(a) ? a.toLowerCase() : a.toUpperCase() ).join``;
}'a'

Powyższa funkcja będzie uniwersalna. Owszem. Tyle, że rozwiązanie na bitach bardziej mi się podoba

Demo kodów switchCaseBin i switchCaseAll

SwitchCase - live

Przekonwertuj ciąg znaków:

Rezultat

Jozdowska Edyta * FullStack Developer

Pisanie kodu jest moją pasją. Zajmuję się tym od przeszło 10 lat, z większą lub mniejszą intensywnością.
Piszę kod w PHP, JS, SCSS i Python. Nie stronię też od poznawania nowych, lub jak kto woli starych rozwiązań jak Jekyll oraz innych języków np. Java.

więcej o mnie

↑

Zamiana dużych liter na małe i odwrotnie na operacjach bitowych

Unicode

Operacje bitowe

Operator bitowej różnicy symetrycznej

Binarna zamiana znaków

Polskie znaki diakrytyczne

Demo kodów switchCaseBin i switchCaseAll

SwitchCase - live

Jozdowska Edyta * FullStack Developer

Powiązane posty:

Obiektowo w JS - czyli klasy 11 Sierpień 2022

Algorytm QuickHull do obliczenia otoczki wypukłej (convex hull) cz. 2 11 Grudzień 2021

Algorytm QuickHull do obliczenia otoczki wypukłej (convex hull) cz. 1 01 Grudzień 2021

Vue + htaccess 18 Luty 2021