Spiegazione file .dll
In informatica, una dynamic-link library (termine inglese, tradotto in italiano libreria a collegamento dinamico) è una libreria
software che viene caricata dinamicamente in fase di esecuzione, invece di essere collegata staticamente ad un eseguibile in fase di compilazione. Queste librerie sono note con l'acronimo DLL, che è l'estensione del file che hanno nel sistema operativo Microsoft Windows, o anche con il termine librerie condivise (da shared library, usato nella letteratura dei sistemi Unix). Nei sistemi che usano ELF come formato dei file eseguibili, come ad esempio Solaris o Linux, sono anche note come ".so", abbreviazione di Shared Object.
Vantaggi e svantaggi
La separazione del codice in librerie a collegamento dinamico permette di spezzare i programmi in parti concettualmente separate, che verranno caricate solo se effettivamente necessarie. Inoltre, una singola libreria può essere caricata in memoria una sola volta e utilizzata da più programmi, il che permette di risparmiare le risorse del sistema. Questo metodo di loading on demand consente, inoltre, installazioni parziali di un sistema software, in cui sono effettivamente presenti sulla memoria di massa solo le librerie associate alle funzioni che l'utente desidera.
Un altro vantaggio è la possibilità di aggiornare un programma modificando solo le DLL: inserendo una versione diversa della DLL, che contiene ad esempio dei bug fix, tutti i programmi che la usano saranno automaticamente "aggiornati" senza bisogno di essere ricompilati.
Il principale svantaggio è legato al fatto che una nuova versione di una DLL potrebbe effettuare dei cosiddetti breaking changes in modo volontario o a causa di bug. Un breaking change è una modifica del comportamento di una funzione che la rende non più compatibile con le convenzioni in uso (ad esempio, una funzione che prima ritornava NULL in caso di errore nei parametri e ora setta errno e ritorna un valore non nullo). Ancora più critico il caso in cui un programma di installazione sovrascriva una DLL con una versione più vecchia. Questi problemi, ben noti ai programmatori Windows, sono chiamati in gergo"DLL Hell" (inferno delle DLL).
In alcuni sistemi operativi, tipicamente Unix e Unix-like, è possibile far convivere versioni diverse fra loro incompatibili di una stessa libreria, purché entrambe siano presenti sul Filesystem in differenti percorsi e sia possibile in fase di collegamento del programma l'identificazione della versione corretta di libreria da utilizzare. In questa maniera i programmi collegati prima dell'installazione della nuova libreria possono continuare ad avvalersi della vecchia versione.[1]
I sistemi operativi di tipo Windows mantengono un back up delle DLL di sistema in un'apposita memoria cache, nella cartella nascosta system32/dllcache. Nella cartella system32/dll sono invece memorizzate le librerie in uso.
Le DLL in Microsoft Windows
Struttura e funzionamento
Quanto segue descrive la struttura ed il funzionamento di una libreria a collegamento dinamico in ambiente Windows, tuttavia i concetti espressi sono generalmente equivalenti in tutti i sistemi che permettono l'uso di librerie dinamiche.
Una libreria a collegamento dinamico è a tutti gli effetti un codice eseguibile. Ogni file eseguibile (EXE o DLL) dispone di un punto d'ingresso (entry point) invocato dal sistema operativo subito dopo il caricamento. Per una DLL il punto d'ingresso è mappato per convenzione sulla funzione DllMain (a discrezione, comunque, del compilatore).
La funzione DllMain viene invocata, oltre che al caricamento della DLL, anche allo scaricamento e quando un thread viene creato o distrutto nel processo in cui la DLL risiede.
A differenza di un file EXE, la DLL deve uscire dall'entry point non appena ha terminato le inizializzazioni necessarie.
Struttura
Per semplificare, possiamo pensare ad una libreria come ad una raccolta di funzioni. Ognuna di queste funzioni avrà il proprio indirizzo di base, calcolato come offset rispetto all'indirizzo di base assegnato dal sistema operativo durante il caricamento della libreria (vedi paragrafo successivo). Ciò che distingue una libreria dinamica è che queste funzioni possono essere esportate, ovvero i loro nomi vengono posti in una lista in una sezione dell'eseguibile. Perciò è possibile determinare il punto di ingresso di una funzione con una ricerca testuale basata sul nome della funzione. Questa operazione è svolta dall'API GetProcAddress che restituisce l'indirizzo della funzione il cui nome è passato come parametro.
Caricamento
Le librerie dinamiche vengono caricate dal sistema operativo all'interno dello spazio di memoria del processo che le ha richieste. In questo modo l'accesso al codice della DLL avrà prestazioni quasi equivalenti a quelle del codice dell'applicazione stessa o del codice delle librerie statiche (vedremo in seguito perché quasi equivalenti).
Per evitare che il codice dell'applicazione e quello della DLL occupino la stessa posizione in memoria, il linker dovrà predisporre la DLL per la rilocazione. In pratica, il sistema operativo determina un'area di memoria disponibile e rimappa ogni riferimento alla memoria contenuto nella DLL. Siccome quest'operazione richiede tempo, ogni DLL dispone di un proprio indirizzo di base ideale: la rilocazione sarà necessaria solo se a questo indirizzo predeterminato è già stata mappata una precedente DLL. Per specificare l'indirizzo ideale si può usare una regola empirica, basata sulla lettera iniziale del nome della DLL, secondo la seguente tabella:
Lettera iniziale Indirizzo di base
A-C 0x60000000
D-F 0x61000000
G-I 0x62000000
J-L 0x63000000
M-O 0x64000000
P-R 0x65000000
S-U 0x66000000
V-X 0x67000000
Y-Z 0x68000000
Collegamento ad un eseguibile
Il collegamento di un eseguibile ad una libreria dinamica avviene durante l'esecuzione (a run time) ed avviene tramite l'API LoadLibrary, che accetta in input il nome della libreria. Ad esempio LoadLibrary(_T("MyLib.dll") caricherà all'interno dello spazio di memoria dell'applicazione la DLL MyLib.dll.
Il collegamento può essere di due tipi: esplicito o implicito.
Collegamento esplicito
Il collegamento esplicito viene gestito direttamente dal codice del programma con l'utilizzo delle due API LoadLibrary e GetProcAddress precedentemente descritte. Se si utilizza il linguaggio C si allocherà un puntatore alla funzione specificata nel quale, al momento di utilizzare la funzione richiesta, si caricherà l'indirizzo con GetProcAddress. Questa tecnica permette di gestire in modo appropriato la condizione nella quale una DLL richiesta non è presente nel sistema, ma in generale è più macchinosa perché richiede l'utilizzo esplicito delle due API. Questa tecnica è indispensabile usando alcuni linguaggi di programmazione, quali ad esempio Visual Basic.
Collegamento implicito
Il collegamento implicito è gestito direttamente dal linker in fase di compilazione, ed è usato quando si assume che una DLL sia sempre presente nel sistema. Ogni volta che nel codice sorgente è richiamata una funzione contenuta in una DLL, il linker collegherà la chiamata a funzione ad una funzione stub, ovvero ad una funzione fittizia. All'interno dell'eseguibile vi sarà una tabella contenente gli stub a tutte le funzioni di DLL richieste. In fase di caricamento dell'eseguibile, il sistema operativo caricherà in automatico tutte le DLL richieste e mapperà ogni stub al punto di ingresso della relativa funzione nella relativa DLL. Se una DLL (o anche una singola funzione in una DLL) richiesta non viene trovata il sistema operativo bloccherà l'avvio del programma con un messaggio di errore.
L'utilizzo del collegamento implicito ha uno svantaggio in termini di prestazioni, perché ogni volta che viene richiamata una funzione contenuta in una DLL vi è un doppio salto a funzione: prima allo stub e poi all'indirizzo della funzione; l'overhead generato è in realtà trascurabile.
Collegamento implicito ritardato
Una variante al collegamento implicito prevista da alcuni compilatori è il collegamento ritardato. In questo caso viene utilizzato uno stub speciale, che non viene mappato al caricamento dal sistema operativo. Questo stub invece, la prima volta che verrà invocato, si mapperà automaticamente (con la tecnica del collegamento esplicito) alla funzione della DLL. Questa tecnica ha il vantaggio di non richiedere la presenza della DLL per il caricamento dell'eseguibile, insieme alla comodità di non dover caricare esplicitamente da codice la libreria.