Precedente: , Su: Concetti fondamentali   [Contenuti][Indice]


D.2 Valore dei dati in un computer

In un programma si tiene traccia di informazioni e valori in contenitori chiamati variabili. Una variabile è solo un nome per designare un certo valore, come nome, cognome, indirizzo, e così via. awk ha molte variabili predefinite, e ha dei nomi speciali per designare il record in input corrente e i campi che compongono il record stesso. Si possono inoltre raggruppare molti valori associati tra di loro sotto un unico nome, utilizzando un vettore.

I dati, in particolare in awk, possono avere valori numerici, come 42 o 3.1415927, o avere come valore delle stringhe. Un valore di tipo stringa è essenzialmente qualsiasi cosa che non sia un numero, per esempio un nome. Le stringhe sono talora chiamate dati di tipo carattere, poiché memorizzano i singoli caratteri che le formano. Le singole variabili, come pure le variabili numeriche e di tipo stringa, sono definite come valori scalari. Raggruppamenti di valori, come i vettori, non sono scalari.

Una descrizione generale dell’aritmetica del computer, ha fornito un’introduzione di base ai tipi numerici (interi e in virgola mobile) e a come questi sono usati in un computer. Si consiglia di rileggere quelle informazioni, comprese le numerose avvertente là esposte.

Mentre è probabile che ci si sia abituati all’idea di un numero senza un valore (cioè, allo zero), richiede un po’ più di riflessione abituarsi all’idea di dati di tipo carattere a lunghezza zero. Nonostante ciò, questo tipo di dato esiste. È chiamato stringa nulla. La stringa nulla è un dato di tipo carattere che non ha un valore. In altre parole, è vuoto. Si scrive così nei programmi awk: "".

Gli esseri umani sono abituati a usare il sistema decimale, cioè a base 10. In base 10, i numeri vanno da 0 a 9, e poi “vengono riportati” nella colonna colonna successiva. (Chi si ricorda la scuola elementare? 42 = 4 x 10 + 2.)

Ma esistono anche altre basi per i numeri. I computer normalmente usano la base 2 o binaria, la base 8 o ottale, e la base 16 o esadecimale. Nella numerazione binaria, ogni colonna rappresenta il doppio del valore della colonna alla sua destra. Ogni colonna può contenere solo uno 0 o un 1. Quindi, il numero binario 1010 rappresenta (1 x 8) + (0 x 4) + (1 x 2) + (0 x 1), ossia il numero decimale 10. Le numerazioni ottale ed esadecimale sono trattate più ampiamente in Numeri ottali ed esadecimali.

Al livello più basso possibile, i computer memorizzano i valori come gruppi di cifre binarie, o bit. I computer moderni raggruppano i bit in gruppi di otto, detti byte. Applicazioni avanzate talora hanno necessità di manipolare i bit direttamente, e gawk è dotato di apposite funzioni.

I programmi sono scritti nei linguaggi di programmazione. Esistono centinaia, se non migliaia, di linguaggi di programmazione. Uno dei più diffusi è il linguaggio di programmazione C. Il linguaggio C ha esercitato un’influsso molto forte nella progettazione del linguaggio awk.

Ci sono state parecchie versioni di C. La prima è spesso designata come “K&R” C, dalle iniziali di Brian Kernighan e Dennis Ritchie, gli autori del primo libro sul C. (Dennis Ritchie ha creato il linguaggio, e Brian Kernighan è stato uno dei creatori di awk.)

A metà degli anni ’80 è iniziato uno sforzo rivolto a produrre uno standard internazionale per il C. Questo lavoro ha raggiunto un punto di arrivo nel 1989 con la produzione dello standard ANSI per il C. Questo standard è diventato uno standard ISO nel 1990. Nel 1999, uno standard ISO C revisionato è stato approvato e pubblicato. Dove è opportuno, POSIX awk è compatible con lo standard ISO C del 1999.


Precedente: , Su: Concetti fondamentali   [Contenuti][Indice]