Informatica Solubilità e lipofilia in funzione del pH
di Elena Fioravanzo, Filippo Magnaguagno,Massimo Mabilia
Due software che utilizzano un recente algoritmo per lapredizione di proprietà chimico-fisiche quali la solubilitàe la lipofilia anche in funzione del pH. Diversi set dimolecole organiche vengono utilizzati per verificare labontà delle predizioni del Log P e confrontatal’accuratezza raggiunta nel calcolo del Log P con quellaottenibile con la predizione del Log D, valore di Log Pche tiene conto della ionizzazione delle molecole edipende quindi dal pH. La lipofilia gioca spesso un ruolo significativo nel determina-
re l’attività biologica di piccole molecole organiche. Influen-
Figura 1 - Rappresentazione grafica e relativi dati statistici della
za, infatti, sia le interazioni idrofobiche tra il recettore e il ligan-
relazione tra valori di Log P sperimentali e calcolati da ACD/LogP
do sia le sue proprietà farmacocinetiche quali ad esempio l’as-
sorbimento o il trasporto attraverso la membrana cellulare. Lalipofilia è quindi, al di là dell’esatto meccanismo di intervento,
stimare il coefficiente di partizione di un composto, quindi, si
un termine fondamentale nelle relazioni quantitative attività bio-
suddivide la molecola in frammenti e si sommano i diversi con-
logica-struttura molecolare (Quantitative Structure - Activity Re-
tributi tenendo conto anche di appropriati fattori di correzione
Nella maggior parte dei casi la lipofilia è misurata con il coeffi-
La filosofia di Leo e Hansch è invece di determinare in modo
ciente di partizione ottanolo-acqua cioè il rapporto tra la con-
molto accurato i valori di Log P di un set di piccole molecole e
centrazione di un soluto in ottanolo rispetto a quella in acqua in
di calcolare il contributo dei vari frammenti da questi dati. An-
un sistema a due fasi all’equilibrio. Dato che i valori misurati del
che questo sistema include molti fattori di correzione.
coefficiente di partizione variano da meno di 10-4 a più di 108
Dato che la frammentazione di una molecola, utilizzata dai due
(almeno dodici ordini di grandezza), si usa comunemente il lo-
approcci precedenti, non è univoca, Broto e Moreau hanno svi-
garitmo della costante di equilibrio della partizione di un soluto,
luppato un metodo alternativo che si basa su contributi atomici
Log P, per caratterizzarne i valori.
al valore totale di Log P del composto. In questo modo si evita
Esiste un rinnovato interesse per lo sviluppo di metodi per il
il passaggio critico della suddivisione della molecola in fram-
calcolo del valore del Log P [1] visto che la lipofilia, esercitando
menti utili, ma ci si trova nella necessità di utilizzare un elevato
una notevole influenza sia sul trasporto del ligando sia sull’inte-
numero di “atom type” non sempre facilmente definibili. Il con-
razione di questo con il recettore, ha un grande valore pratico
tributo di un singolo atomo alla lipofilia totale di una molecola
per la derivazione di modelli quantitativi per l’attività biologica.
dipende, infatti, non solo dal tipo di atomo considerato, ma an-
Tra i metodi disponibili per la stima del Log P ecco i più utilizzati:
che dall’intorno in cui esso si trova nella molecola.
- il metodo della costante f di Rekker [2];- l’approccio frammentale di Leo e Hansch [3];
- l’approccio di Broto e Moreau [4]. Rekker definisce dapprima un arbitrario set di frammenti mole-
Il Log P è un parametro teorico che caratterizza solamente le
colari utilizzando un database di circa mille composti di cui è
strutture neutre. Spesso però le molecole, ad esempio i farmaci
noto il Log P. Effettua poi un’analisi di regressione lineare utiliz-
in condizioni fisiologiche, esistono come elettroliti ionizzati. Per
zando i valori di Log P come variabile dipendente. I coefficienti
questa ragione il Log D, che tiene conto della ionizzazione del-
ottenuti sono utilizzati come contributi dei vari frammenti. Per
le molecole, è meglio correlato all’attività biologica o a proprietàmacroscopiche e può essere messo direttamente in relazione
Elena Fioravanzo, Filippo Magnaguagno, Massimo Mabilia, S.In - So-
con il trasporto di molecole ionizzabili o con la loro interazione
luzioni Informatiche, via G. Salvemini 9 - 36100 Vicenza, www.s-in.it.
con il recettore. Queste considerazioni sono peraltro conferma-
Chimica & Industria - Giugno 2001Informatica
te dal recente paragone, riportato in lette-
Valori sperimentali di Log D e Log P* confrontati rispettivamente con i valori
ratura, delle correlazioni di Log P e Log D
calcolati da ACD/LogD e ACD/LogP
con costanti di inibizione di enzimi e co-stanti di “binding” [5]. In tutti i casi analiz-
zati utilizzando il Log P si ottengono coef-
ficienti di correlazione R <0,90, mentrecon il Log D si hanno valori di R >0,99.
L’unico vantaggio dell’utilizzo del parame-
tro Log P invece di Log D è che quest’ulti-
sono presentati due software che utilizza-
no un recente algoritmo per la predizione
del Log P e del Log D. Si utilizzano diver-
si set di molecole organiche per verificare
la bontà delle predizioni del Log P e si
confronta l’accuratezza raggiunta nel cal-
colo del Log P con quella ottenibile con la
Materiali e metodi
Il primo set di molecole in esame è forma-
to da 75 molecole organiche [6] i cui pesi
spongono i valori sperimentali di Log P.
Le strutture bidimensionali sono state ge-nerate, a partire dai nomi di uso comune,
mOffice di CambridgeSoft Co. [7]) e inse-
rite in un foglio di calcolo di Accord for
Excel (di Synopsys Ltd. [8]) da cui risulta
agevole l’esportazione di file in formato
lo automatico del valore teorico di Log P.
interesse biologico appartenenti a diverse
categorie terapeutiche per le quali sonodisponibili i dati di Log P* [9] (Tabella). Le
strutture bidimensionali e i dati relativi alle
categorie terapeutiche sono stati tratti da
Dictionary (ACD/ChemSketch di Acd Inc.
[10]) e inseriti, insieme ai dati di Log P*, in
(ChemOffice di CambridgeSoft Co. [7]). È
stato quindi esportato un file SD utilizzato
Il set è composto da 21 molecole di inte-
resse biologico, 19 delle quali fanno an-che parte del set 2. Per queste molecole
sono disponibili valori di lipofilia determi-
(a) valore di Log D calcolato e misurato al pH indicato
nati sperimentalmente a diversi valori di
(b) valore di Log D calcolato senza ripartizione ionica (ion-pair partiotining)
Chimica & Industria - Giugno 2001Informatica
molecole sono disponibili anche i valori sperimentali di pKa[12]. Le strutture sono state generate con l’aiuto di Dictionary
(ACD/ChemSketch di Acd Inc. [10]) e inserite in un foglio di cal-colo di Accord for Excel (di Synopsys Ltd [8]). Infine sono state considerate due molecole che rappresentanodei casi particolari: la furosemide per la quale lo storico valoresperimentale di Log P proposto sembra non essere corretto ela fenilalanina, a rappresentare gli amminoacidi in generale. • ACD/LogPL’algoritmo utilizzato da ACD/LogP è stato sviluppato utilizzan-do un “training set” che contiene oltre 5.000 valori di Log P de-terminati sperimentalmente. Questo algoritmo include contributidi atomi separati, di oltre 500 frammenti strutturali e di oltre2.000 tipi di interazioni intramolecolari tra diversi frammenti. ACD/LogP offre anche la possibilità di includere “nuovi” fram-
menti nel database in modo che l’utente possa migliorarne lecapacità predittive utilizzando i propri dati sperimentali (“lear-ning system”). È sufficiente fornire al programma una nuovastruttura con il relativo valore sperimentale di Log P: la strutturasarà automaticamente suddivisa in frammenti per i quali saràcalcolato l’incremento additivo a partire dal dato sperimentale. Questi nuovi dati saranno aggiunti al database già disponibileed eventualmente utilizzati per successivi calcoli, in base allaloro rilevanza statistica. È generalmente sufficiente aggiungereal sistema il dato misurato per una sola struttura che appartie-ne a una nuova classe di composti per migliorare ulteriormentele predizioni di Log P di altre molecole appartenenti alla stessaclasse. Il programma è quindi personalizzabile dall’utente inbase alle proprie esigenze. • ACD/pKaIl pKa è una misura della tendenza di una molecola o ione a
trattenere un protone, H+ sui suoi centri di ionizzazione. Più fa-cilmente una molecole si ionizza, più questo composto tenderàa rimanere in una soluzione acquosa dato che l’acqua è un po-tente solvente polare. Se una molecola si ionizza difficilmentequesta tenderà a distribuirsi maggiormente in un solvente non-polare quali cicloesano o ottanolo. Il valore di Log P di un com-posto è quindi strettamente dipendente dal suo valore di pKa. In termini biologici il pKa è un fattore importante nel determina-re se una molecola tenderà a essere assorbita dai componentiacquosi del tessuto cellulare oppure dalla membrana lipidica. ACD/pKa (di Acd Inc. [10]) calcola accurate costanti di ionizza-zione acido-base (valori di pKa) a 25 °C e forza ionica zero insoluzione acquosa di molecole organiche. Il programma utiliz-za un approccio frammentale e un database interno contenen-te 8.000 strutture con oltre 23.000 valori sperimentali di pKa. Anche ACD/pKa permette l’implementazione del database in-terno con dati sperimentali forniti dall’utente. Il programma cal-
Figura 2 - Rappresentazione grafica e relativi dati statistici della
cola sia le costanti di dissociazione osservate o macroscopi-
relazione tra valori di Log P sperimentali e calcolati con il metodo
che che le costanti di dissociazioni microscopiche di specifiche
implementato in ACD/LogP DB (a), il metodo di Leo e Hansch (b)
forme ioniche che potrebbero essere presenti in un sistema
e il metodo di Rekker (c) per le 20 molecole del set 2Risultati e discussione • ACD/LogD che contiene ACD/LogP e ACD/pKaQuesto programma (di Acd Inc. [10]), unendo le caratteristiche
di ACD/LogP a quelle di ACD/pKa DB, è in grado di calcolare
sia il valore di Log P apparente che quello della solubilità in ac-
in esame è 0,29. Gli errori commessi da ACD/logP variano da
un massimo di 0,95 a un errore minimo <0,01 per ben 17 com-
Chimica & Industria - Giugno 2001Informatica
Una possibile spiegazione [11] di quanto qui osservato è che ivalori di Log P sono determinati sperimentalmente in modo me-no accurato dei corrispondenti valori di Log D. Il Log P deveessere infatti ottenuto in condizioni tali da annullare la ionizza-zione delle molecole essendo un parametro relativo alla mole-cola neutra. Questo significa in molti casi dover lavorare a valo-ri di pH estremi (pH >10 o pH <2) condizioni in cui la lipofiliapotrebbe essere influenzata da altri effetti non osservabili nellecondizioni cui sono ottenuti la maggior parte dei valori di Log D(pH tra 5 e 8). In Figura 4 sono invece riportati i valori sperimentali di pKa di-sponibili per le 21 strutture del set 3 e i relativi valori predetti daACD/pKa. Il coefficiente di correlazione ottenuto è 0,97 mentrel’errore standard della stima commesso è 0,45. Due casi particolari Figura 3 - Rappresentazione grafica e relativi dati statistici dellarelazione tra valori di Log P sperimentali determinati a diversivalori di pH per le molecole del set 3 confrontati con i valori
Sia Rekker [14] sia Leo [15] sono d’accordo nell’affermare che
il valore di Log P di -0,83 inizialmente indicato per la furosemi-de non sia corretto. Questo valore è stato originalmente misu-
posti. Il coefficiente di correlazione R2 tra i valori sperimentali e
rato [16] e riportato senza indicazioni di un controllo del pH. Si
può quindi sospettare che il valore sia stato ottenuto a pH 7 e
In Figura 1 viene rappresentato il grafico dei valori sperimentali
che non sia stata applicata una correzione adeguata alla forma
di lipofilia contro i valori predetti.
ionizzata della molecola. Possiamo verificare questa ipotesi uti-lizzando ACD/LogD che effettivamente calcola un valore di
-0,83 proprio a pH 7,05, valore cui l’acido della furosemide è io-
In Tabella sono riportati i valori di Log P sperimentali (logP*
nizzato (Figura 5). Questi risultati sono convalidati anche da
[13]) e calcolati con il metodo frammentale applicato da
successive misurazioni che indicano valori sperimentali di Log
ACD/LogP. Per le stesse molecole sono disponibili anche i va-
P uguale a -1,06 [17a] o a -0,92 [17b] a pH 7,4, e un valore di
lori di lipofilia calcolati con altri due metodi: il metodo di Leo
-0,99 a pH 7,4 calcolato da ACD/LogD.
Hansch [13] utilizzato per calcolare il valore di CLOGP, il meto-
Per quanto riguarda il Log P (relativo cioè alla molecola neutra),
si può quindi sostituire all’iniziale valore di -0,83, il valore speri-
Con il metodo implementato nel software ACD applicato al set
mentale di 2,03 determinato a pH 2,0 [17a] che è possibile para-
di molecole in esame si sono ottenuti risultati migliori rispetto
gonare al valore 2,88 calcolato da ACD/LogD allo stesso pH.
alle predizioni effettuate con i due metodi tradizionali presi inconsiderazione. I coefficienti di correlazione R2 tra dato speri-
mentale e valore calcolato sono infatti di 0,96 per il programmaACD, 0,89 per il metodo di Hansch e Leo e 0,88 per il metodo
Quest’ultimo esempio è particolarmente significativo per illu-
di Rekker che corrispondono, rispettivamente a un errore stan-
strare l’utilità e spesso la necessità di calcolare valori di lipofilia
• Set 3In Tabella è riportato il Log D sperimentale misurato a diversivalori di pH e il rispettivo valore calcolato da ACD/LogD [10]. Ilcoefficiente di correlazione R2 ottenuto tra valore sperimentalee valore calcolato è di 0,96 mentre l’errore standard della stima(s
Paragonando questo risultato con l’errore standard commessoda ACD/LogP, 0,33, su di un set di molecole analogo a questo(set 2) nel predire i valori di Log P si potrebbe concludere che ilLog D è predetto con analoga o addirittura maggiore accura-tezza del valore di Log P. Questo risultato è alquanto inaspet-tato dato che il calcolo del parametro Log D è molto più com-plesso del calcolo del semplice valore di Log P. La predizionedel Log D prevede infatti il calcolo sia dei valori individuali diLog P, per tutte le forme ioniche della molecola, sia del valoredella costante di dissociazione acido-base, pKa, della molecolastessa. È lecito quindi aspettarsi che l’errore commesso da una
Figura 4 - Rappresentazione grafica e relativi dati statistici della
predizione di Log D sia maggiore di quello commesso nel pre-
relazione tra valori di pKa sperimentali e i valori calcolati da
dire il Log P per la molecola neutra.
Chimica & Industria - Giugno 2001Informatica Figura 5 - Calcolo della lipofilicità della furosemide Figura 6 - Calcolo della lipofilicità della fenilalanina
in funzione del pH. La fenilalanina, come tutti gli amminoacidi,
18, 865, (1975).
esiste principalmente come zwitterione (circa da pH 2 a pH 9),
[4] Broto P., Moreau G., VanDycke C., Eur. J. Med. Chem., 19,
quindi con il gruppo amminico protonato e l’acido carbossilico
deprotonato, mentre non esiste mai, da pH 0 a pH 14, con en-
[5] E.Kolovanov A., Petrauskas M., Vinogradova, Comparison
trambi i gruppi ionizzabili neutri. ACD/LogP, come altri pro-
of LogP and LogD Correlations With Inhibition and Binding
grammi analoghi, presuppone l’utilizzo di molecole con i gruppi
Constants of Enzymes, to be published.
funzionali ionizzabili non carichi (neutri): calcola perciò un valo-
[6] Breindl A., Beck B., Clark T., J. Mol. Model., 3, 142, (1997).
re di lipofilia (1,11) relativo a una specie non esistente commet-
[7] CambridgeSoft Corporation, 100 Cambridge Park Drive,
tendo di fatto un errore di 2,6 unità logaritmiche nella stima del
Cambridge, MA 02140 Usa, Software distribuito da S.IN-Solu-
Log P sperimentale (-1,52). Per contro, ACD/LogD è in grado
di calcolare la lipofilia dello zwitterione con un’ottima approssi-
[8] Synopsys Scientific Systems Ltd., 5 North hill Road, Leeds,
LS6 2EN, United Kingdom, Software distribuito da S.IN-Solu-zioni Informatiche, www.s-in.it. Conclusioni
[9] Rekker R.F., Mannhold R., Calculation of Drug Lipophilicity;Vch Publishers, Inc. New York, NY (Usa).
Il metodo frammentale implementato nei software ACD per la
[10] Advanced Chemistry Development Inc., 90 Adelaide
predizione della lipofilia utilizza nuovi algoritmi rispetto ai meto-
Street West, Suite 702, Toronto, ON, M5H 3V9 Canada, S.IN-
di frammentali tradizionali e si basa su di un vasto database di
Soluzioni Informatiche, www.s-in.it.
dati sperimentali che è in continuo sviluppo. Questo metodo si
[11] Eduard A. Kolovanov, Alanas A. Petrauskas, Comparison
è dimostrato in grado di calcolare il Log P (ACD/LogP DB) di of the Accuracy of Log P and Log D. Calculations for 22 Drugs,
molecole organiche contenenti una vasta gamma di gruppi fun-
www.acdlabs.com/publish/publ_pres.html.
zionali (set 1) con un notevole grado di precisione ottenendo
[12] (a) Clarke’s Isolation and Identification of Drugs, Moffat
A.C. et al., Eds, The Pharmaceutical Press, London, 1986. (b)
ACD/LogD, inoltre, avvalendosi di ACD/pKa DB, è in grado di
Sirius Technical Application Notes, 1 (7), 104 (1994). (c) A. E.
predire valori di lipofilia in funzione del pH con lo stesso grado
Martell, R.M. Smith, “Critical Stability Constants”, 1974-1989, v.
=0,31) con il quale vengono predetti i valori
1-6. (d) B. Hansen, Acta. Chem. Scand., 12, 324 (1958). (e) Si-
di Log P per molecole neutre (set 2 e 3) da ACD/LogP
rius Technical Application Notes, 2 (6), 93 (1995).
=0,33), e addirittura superiore alle predizioni di Log P otte-
[13] Craig P.N., Drug Compendium, in: Vol. VI, Cumulative
Subject Index & Drug Compedium (Vol. Ed. Drayton , C.J.) of:
=0,54). Va infine ricordato che, grazie al calcolo della pKa
Comprehensive Medicinal Chemistry. The Rational Design,
e della lipofilia, ACD/LogD è in grado anche di stimare la solu-
Mechanistic Study and Therapeutic Application of Chemical
bilità in acqua di molecole organiche in funzione del pH.
Compounds (Eds. Hansch, C.; Sammes, P.G.; Taylor, J.B.),Pergamon Press-Oxford, 1990. Bibliografia
[14] Rekker R.F., ter Laak A.M., Mannhold R., Quant. Struct. - Act. Relat., 12, 152, (1993).
[1] Ghose A.K., Crippen G.M., J. Comp. Chem., 7, 565,
[15] Leo A.J., Chem. Pharm. Bull., 43, 512, (1995).
(1986). (b) Viswanadhan V.N., Ghose A.K., Ravankar G.R.,
[16] Horstmann H., Moller E., Wehinger E., Meng K, ACS
Robins R.K., J. Chem. Inf. Comput. Sci., 29, 163, (1989). (c) Symposium Series, 83, 125, (1978).
Klopman G., Wang, S., J. Comp. Chem., 12, 1025, (1991).
[17] (a) Mork N., Bundgaard H., Shalmi M., Christensen S., Int.
[2] Rekker R.E., The Hydrophobic Fragment Constant, Else-
J. Pharm., 60 (2), 163, (1990). (b) Masereel B., Lohrmann E.,
Schynts M., Pirotte B., Greger R., Delarge J., J. Pharm. Phar-
[3] Leo A.J., Jow P.Y.C., Silipo C., Hansch, C. J. Med. Chem.,
macol., 44 (7), 589, (1992).
Chimica & Industria - Giugno 2001
Sri Lanka Association for Artificial Intelligence (SLAAI) Proceedings of the third Annual Sessions Recent Developments in Bayesian Approach in Filtering Junk E-mail Department of Electrical and Computer Engineering, Abstract standardized definition for spam, however in generally the word “spam” is used to refer to unwanted “garbage” e-mail massages. Spam Junk mail is one
Ganzheitliche homöopathische Therapie der ErkältungskrankheitenDie Modulare Immun-ResonanztherapieIn der Offizin haben homöopathische Komplexmittel einen hohen nähert, muss man nahezu zwingend die Stel enwert, unter anderem auch bei der Behandlung der Erkältungs-Selye berücksichtigen. Banale Infekte, ein krankheiten. Oft stehen Patienten mit einem konkreten Präparate- leichter Schnupf