Precedente: Fondamenti ad alto livello, Su: Concetti fondamentali [Contenuti][Indice]
In un programma si tiene traccia di informazioni e valori in contenitori
chiamati variabili. Una variabile è solo un nome per designare un certo
valore, come nome
, cognome
, indirizzo
, e così via.
awk
ha molte variabili predefinite, e ha dei nomi speciali per
designare il record in input corrente e i campi che compongono il record
stesso. Si possono inoltre raggruppare molti valori associati tra di loro
sotto un unico nome, utilizzando un vettore.
I dati, in particolare in awk
, possono avere valori numerici, come 42
o 3.1415927, o avere come valore delle stringhe. Un valore di tipo stringa è
essenzialmente qualsiasi cosa che non sia un numero, per esempio un nome. Le
stringhe sono talora chiamate dati di tipo carattere, poiché memorizzano
i singoli caratteri che le formano. Le singole variabili, come pure le
variabili numeriche e di tipo stringa, sono definite come valori
scalari. Raggruppamenti di valori, come i vettori, non sono scalari.
Una descrizione generale dell’aritmetica del computer, ha fornito un’introduzione di base ai tipi numerici (interi e in virgola mobile) e a come questi sono usati in un computer. Si consiglia di rileggere quelle informazioni, comprese le numerose avvertente là esposte.
Mentre è probabile che ci si sia abituati all’idea di un numero senza un valore
(cioè, allo zero), richiede un po’ più di riflessione abituarsi all’idea di
dati di tipo carattere a lunghezza zero. Nonostante ciò, questo tipo di dato
esiste. È chiamato stringa nulla. La stringa nulla è un dato di tipo
carattere che non ha un valore. In altre parole, è vuoto. Si scrive così nei
programmi awk
: ""
.
Gli esseri umani sono abituati a usare il sistema decimale, cioè a base 10. In base 10, i numeri vanno da 0 a 9, e poi “vengono riportati” nella colonna colonna successiva. (Chi si ricorda la scuola elementare? 42 = 4 x 10 + 2.)
Ma esistono anche altre basi per i numeri. I computer normalmente usano la base 2 o binaria, la base 8 o ottale, e la base 16 o esadecimale. Nella numerazione binaria, ogni colonna rappresenta il doppio del valore della colonna alla sua destra. Ogni colonna può contenere solo uno 0 o un 1. Quindi, il numero binario 1010 rappresenta (1 x 8) + (0 x 4) + (1 x 2) + (0 x 1), ossia il numero decimale 10. Le numerazioni ottale ed esadecimale sono trattate più ampiamente in Numeri ottali ed esadecimali.
Al livello più basso possibile, i computer memorizzano i valori come gruppi di
cifre binarie, o bit. I computer moderni raggruppano i bit in gruppi di
otto, detti byte. Applicazioni avanzate talora hanno necessità di
manipolare i bit direttamente, e gawk
è dotato di apposite funzioni.
I programmi sono scritti nei linguaggi di programmazione. Esistono centinaia,
se non migliaia, di linguaggi di programmazione. Uno dei più diffusi è il
linguaggio di programmazione C. Il linguaggio C ha esercitato un’influsso
molto forte nella progettazione del linguaggio awk
.
Ci sono state parecchie versioni di C. La prima è spesso designata come
“K&R” C, dalle iniziali di Brian Kernighan e Dennis Ritchie,
gli autori del primo libro sul C. (Dennis Ritchie ha creato il linguaggio,
e Brian Kernighan è stato uno dei creatori di awk
.)
A metà degli anni ’80 è iniziato uno sforzo rivolto a produrre uno
standard internazionale per il C. Questo lavoro ha raggiunto un punto di
arrivo nel 1989 con la produzione dello standard ANSI per il C.
Questo standard è diventato uno standard ISO nel 1990.
Nel 1999, uno standard ISO C revisionato è stato approvato e pubblicato.
Dove è opportuno, POSIX awk
è compatible con lo standard
ISO C del 1999.
Precedente: Fondamenti ad alto livello, Su: Concetti fondamentali [Contenuti][Indice]