Perl – Alla scoperta dei Linguaggi di scripting Linux
PERL è senza dubbio il linguaggio di scripting Unix di terze parti attualmente più importante, definito per molto addetti ai lavori il “coltellino svizzero” degli strumenti di programmazione.
Alla scoperta di PERL
Perl è un linguaggio di programmazione ad alto livello, dinamico, procedurale e interpretato, creato nel 1987 da Larry Wall. Perl ha un singolare insieme di funzionalità ereditate da C, scripting shell Unix (sh), Awk, sed e in diversa misura da molti altri linguaggi di programmazione, compresi alcuni linguaggi funzionali.
Benché sia molto noto come linguaggio per lo sviluppo di CGI, Perl è stato creato inizialmente come ausilio ai sistemisti, come linguaggio di manipolazione di testo e file. Infatti è anche detto Practical Extraction and Report Language, ma questo è un acronimo assegnato dopo la creazione del nome o, in inglese, un “backronym”. Pertanto secondo la documentazione stessa di Perl, non vi si dovrebbe mai riferire come “PERL”, ma come “Perl” o “perl” a seconda che si intenda il linguaggio in quanto tale o una specifica implementazione rispettivamente. È anzi questa un’informazione utilizzata negli ambienti perlistici per distinguere “chi è del giro” da chi non lo è.
Si è evoluto nel tempo, anche grazie ad un potente sistema di moduli, in un linguaggio a carattere più generale, comprendente l’elaborazione di immagini, l’interrogazione di banche dati, i processi di comunicazione via rete, ed utilizzabile in tutti quegli ambiti in cui non siano strettamente necessarie le performance di un linguaggio compilato più a basso livello, offrendo al contempo tempi di sviluppo molto più rapidi. È quindi anche utilizzato per la prototipizzazione di programmi da implementarsi in altri linguaggi.
Il linguaggio è stato pensato per essere pratico (facile da usare, efficiente, completo) oltre che bello e “magico” (è questo un concetto tipicamente perlistico); esso non è mai stato pensato per essere compatto, elegante o minimale, infatti il suo motto più distintivo è riassunto nell’acronimo TMTOWTDI (There is More Than One Way To Do It), che in italiano molto indicativamente significa “c’è più di un modo per farlo”. Tuttavia uno dei suoi maggior pregi è che grazie a tale ricchezza consente di risolvere con grande semplicità ed eleganza problemi che con altri linguaggi richiederebbero notevoli sforzi. Infatti Larry Wall ama ripetere che uno dei suoi obiettivi è “rendere le cose facili, facili, e quelle difficili, possibili”.
Perl supporta sia il paradigma procedurale che quello ad oggetti, ha potenti funzioni per l’elaborazione dei testi ed è dotato di una delle maggiori collezioni di moduli prodotte dalla sua vasta comunità di utenti.
Se a prima vista il Perl appare largamente derivato dal C, in verità ha ricevuto questa somiglianza mediata dai linguaggi di scripting delle shell. Perl è un linguaggio procedurale non tipizzato con variabili, espressioni, assegnamenti, blocchi delimitati da graffe, strutture di controllo e subroutine. Queste ultime possono essere intese come funzioni e il Perl ha numerose doti mediate dai linguaggi funzionali.
PERL e le variabili
Le variabili hanno un prefisso ($ per variabili scalari, @ per array, % per hash) detto sigillo e se questo in parte ha determinato la ricchezza sintattica del Perl, permette l’interpolazione delle variabili nelle stringhe. Come le shell Unix, Perl è dotato di molte funzioni di serie per i compiti più comuni come ordinamento ed accesso al sistema operativo. (In verità solo 279 nel nucleo principale del perl, contro le oltre 3000 del PHP).
Perl ha preso i vettori associativi (conosciuti come ‘hash’) da awk e le espressioni regolari da sed. Queste semplificano e facilitano molto il parsing ed i compiti di trattamento del testo e dei dati.
Inoltre c’è la possibilità di integrare codice scritto in C in un programma Perl così come viceversa (aggiungere o riscrivere parti in C/C++ in applicazioni o package Perl, o inserire un embedded Perl in programmi C). In verità con i moduli Inline:: sono diversi i linguaggi in cui possono essere definite le funzioni di un sorgente Perl.
Perl è comunemente ritenuto un linguaggio interpretato, ossia che per essere eseguito viene interpretato al momento dell’esecuzione. In realtà, la prima cosa che fa l’interprete è di trasformare il codice sorgente in bytecode, un po’ come Java; sul bytecode crea un grafo intermedio sul quale applica ottimizzazioni, ed è questo grafo ad essere interpretato. Questo approccio permette di limitare la lentezza tipica dei linguaggi interpretati. La versione del Perl 6[2], in via di sviluppo da alcuni anni, divide l’esecutore del bytecode (o virtual machine) dal linguaggio in modo tale da permetterne l’utilizzo anche da compilatori di altri linguaggi, tra cui Tcl, Python, Java, etc.
La virtual machine che ne deriva sarà una nuova base per lo sviluppo di linguaggi liberi e consentirà livelli di ottimizzazioni molto elevati e indipendenza dallo sviluppo dei linguaggi sovrastanti. Nonostante il Perl 6 non sia ancora distribuito, alcune idee sono percolate nella versione stabile del Perl 5.8 e molte altre avranno un riscontro in Perl 5.10. Un prototipo del Perl 6, chiamato Pugs, è stato sviluppato in Haskell e si sta verificando una interessante fertilizzazione reciproca tra le due comunità (Perl ed Haskell).
Ancora una volta è stato messo in evidenza come il Perl sia un linguaggio “socievole”, che tende quindi a interagire con gli altri linguaggi e ambienti di sviluppo, siano essi: dialetti shell, altri linguaggi interpretati, linguaggi specializzati (come l’SQL), o i più comuni linguaggi compilati. Questa è la ragione che determina il successo di Perl nell’integrazione di sistemi diversi.
Perl è nato in ambiente Unix e distribuito contemporaneamente con due licenze liberali, la GPL e la Licenza Artistica, è disponibile anche per i sistemi operativi Microsoft Windows e MacOS precedente alla versione Mac OS X (che appartiene alla famiglia Unix). L’implementazione per Windows più diffusa viene distribuita da una società, la ActiveState, che da un lato offre sotto una licenza libera moduli specifici per il sistema operativo Windows, dall’altro vende degli ambienti di sviluppo integrati, sia per Perl che per altri linguaggi open source quali ad esempio Python e Tcl.
Benché il Perl sia stato una delle grandi novità nel campo della programmazione, il giudizio su di esso da parte della comunità di programmatori è vario:
- da un lato viene giudicato negativamente per il fatto che facilita la scrittura di programmi difficili da leggere e quindi rendendo complicata la loro manutenzione (al punto che il nome del linguaggio è stato reinterpretato come Pathologically Eclectic Rubbish Lister);
- dall’altro viene apprezzato per la facilità di scrivere programmi potenti ma semplici, per la libertà semantica che lascia al programmatore al punto che “non c’è un unico modo di fare le cose” è uno dei modi di dire legati a Perl.
Wall – che per formazione è un linguista – ritiene questa libertà semantica un pregio, in quanto più simile al linguaggio umano. Un ulteriore aspetto positivo che attrae i programmatori è l’ampia disponibilità di moduli distribuiti con licenze open source, quasi sempre le stesse di Perl. Moduli solitamente documentati bene, in quanto il linguaggio stesso offre il Pod, un modo di includere la documentazione all’interno del codice, garantendo così che assieme al modulo ci sia pure la documentazione. La comunità ha creato un sito particolare, chiamato CPAN, il quale organizza per argomenti i moduli ritenuti particolarmente validi. I moduli stessi non sono archiviati in quel sito, ma rimangono sui siti scelti dai loro autori. Infine, in quanto linguaggio interpretato e dunque sempre distribuito con il codice sorgente visibile, favorisce la pratica liberale.
Altre caratteristiche importanti di Perl sono:
- le variabili di default che sono definite per molte funzioni e operatori builtin del perl
- la sensibilità del contesto negli assegnamenti, dove Perl sa riconoscere cosa restituire in base al left value
- le espressioni regolari, che permettono la ricerca e la sostituzione di stringhe di testo descritte con caratteri speciali
- le chiusure
- la possibilità di applicare paradigmi di programmazione diversi, come quello funzionale o quello ad oggetti.
Alcune caratteristiche del Perl, tra cui la sintassi, permettono una sintesi raramente possibile con altri linguaggi ed impossibile con linguaggi tipo Java e i sorgenti possono dunque essere molto densi di significato, tanto da risultare criptici a chi non ne conosca i rudimenti. In compenso su Internet c’è così tanta documentazione sul Perl che è possibile avvicinarsi rapidamente al linguaggio e con opportuni testi di riferimento iniziarne la strada dell’apprendimento.
Il linguaggio e l’interprete vengono sviluppati da un gruppo di circa cento sviluppatori, guidati da Wall, il quale prende le decisioni finali su cosa includere nel codice. Gli sviluppatori hanno creato il Perl Institute per facilitare lo sviluppo di Perl e migliorarne la visibilità e organizzano conferenze. Wall stesso lavora per la O’Reilly, una casa editrice che sostiene attivamente il movimento Open Source.
Perl fa parte degli strumenti standard dei sistemi operativi Unix. Il suo aggiornamento può essere fatto sia da Internet che tramite le distribuzioni dei sistemi operativi liberi, quali GNU/Linux, BSD, ecc. Le versioni per Windows possono anch’esse essere scaricate da Internet. Ad alcuni manuali di Perl viene allegato un CD-Rom comprendente le versioni per diversi sistemi operativi e tutti i moduli compresi nel CPAN.
La comunità Perl è sovente attaccata per l’assenza di un IDE come quelli presenti per Java che rendano semplice l’avvicinamento al linguaggio da parte dei neofiti. In realtà la ricchezza espressiva del Perl rende complicata la realizzazione di un IDE che evidenzi errori di costruzione degli statement, e dati i numerosi valori di default delle funzioni base risulterebbe oltremodo difficile comprendere in automatico cosa vuole ottenere il programmatore, dove c’è un errore o forse no. Tuttavia Eclipse contiene un’estensione per il Perl e forse altri editor di codice seguiranno.
Perl è installato in quasi tutti i sistemi Unix e Linux. La maggior parte degli amministratori lo mantiene come /usr/bin/perl, anche se si insiste a mantenere tutti gli altri software lontani da /usr.
Problemi con gli script Perl
Se avete qualche problema con uno script Perl, ecco alcuni suggerimenti:
- Cercate di capire quando è stato composto lo script. Potrebbe richiedere una versione di Perl più recente di quella installata.
- Se è un vecchio script, può essere necessario inserire barre retroverse davanti ai caratteri @ nelle stringhe e nei commenti.
- Potrebbe richiedere un modulo che non avete (in particolare un modulo di database).
- Quando tutto il resto fallisce, eseguite
perl - w script
per attivare la modalità di avviso