Differences

This shows you the differences between two versions of the page.

Link to this comparison view

teaching:drughunting [2015-09-11 13:42]
teaching:drughunting [2015-09-11 13:42] (current)
Line 1: Line 1:
 +====== PG 552: Drug Hunting ======
 +Navigation und visuelle Analyse im pharmakologischen Strukturraum
 +
 +===== Neuigkeiten =====
 +  * [[teaching/​drughunting/​seminarthemen|Einteilung der Seminarthemen]]
 +  * E-Mail-Verteiler:​
 +    * pg552{{:​staff:​at.gif|}}ls11.cs.tu-dortmund.de - Betreuer und Teilnehmer der PG
 +    * pg552b{{:​staff:​at.gif|}}ls11.cs.tu-dortmund.de - Nur Betreuer
 +    * pg552s{{:​staff:​at.gif|}}ls11.cs.tu-dortmund.de - Nur Teilnehmer
 +
 +===== Termine =====
 +== Abschlussvortrag ==
 +Donnerstag, 13.10.2011, 10:15 Uhr, OH14 Raum 202
 +== Seminarphase ==
 +  * Dienstag, 12.10, 14:00 Uhr, OH14 Raum 202
 +  * Donnerstag, 14.10, 14:00 Uhr, OH14 Raum 202
 +  * Dienstag, 19.10, 14:00 Uhr, OH14 Raum 202
 +  * Donnerstag, 21.10, 14:00 Uhr, OH14 Raum 202
 +== Vorbesprechung ==
 +Freitag, 16.07, 10:15 Uhr, OH14 Raum 202
 +== Einzelpräsentation ==
 +Dienstag, 18.05, 10:15 Uhr, OH14 Raum 202
 +
 +===== Teilnehmer =====
 +  * Bernhard Dick
 +  * Thorsten Flügel
 +  * Henning Garus
 +  * Michael Hesse
 +  * Philipp Kopp
 +  * Philipp Lewe
 +  * Dominic Sacré
 +  * Till Schäfer
 +  * Thomas Schmitz
 +  * Ömer Uzun
 +
 +
 +===== Organisation =====
 +== Zeitraum ==
 +WiSe 2010/11, SoSe 2011
 +== Umfang ==
 +8 SWS im ersten und zweiten Semester, insgesamt 16 SWS
 +== Veranstalter ==
 +  * [[staff/​klein|Karsten Klein]]
 +  * [[staff/​gutwenger|Carsten Gutwenger]]
 +  * [[staff/​kriege|Nils Kriege]]
 +  * [[staff/​mutzel|Prof. Dr. Petra Mutzel]]
 +== Kooperationspartner ==
 +  * Dr. Stefan Wetzel, stefan.wetzel{{:​staff:​at.gif|}}novartis.com
 +  * Prof. Dr. Herbert Waldmann, Max-Planck-Institut für molekulare Physiologie,​ Dortmund
 +
 +===== Thema =====
 +Entwicklung einer Java-basierten Software zur Navigation und visuellen Analyse im 
 +pharmakologischen Strukturraum mit Hilfe von Verfahren zur Visualisierung und Klassifikation
 +biochemischer Daten. ​
 +
 +|{{ :​teaching:​drughunting:​sh04.png?​300 |Scaffold Hunter}}|{{ :​teaching:​drughunting:​molwind.jpg?​300 |Molwind}}|
 +|  [[http://​scaffoldhunter.sourceforge.net|Scaffold Hunter]] ​ |  [[http://​molwind.sourceforge.net|Molwind]] ​ |
 +|  Software zur Visualisierung des chemischen Strukturraums ​ ||
 +
 +==== Motivation ====
 +Das Finden neuer Wirkstoffe mit pharmazeutischem Nutzen ist eine Kernaufgabe
 +der chemischen Biologie. Innerhalb des //​chemischen Strukturraums//​ (der Gesamtheit ​
 +aller theoretisch möglichen Moleküle) kommt nur ein geringer Teil von kleinen, biologisch
 +aktiven Molekülen als Wirkstoff in Frage. Die geschätzte Anzahl möglicher ​
 +Wirkstoffkandidaten in diesem //​pharmakologischen Strukturraum//​ ist mit 10^60
 +jedoch noch immer immens, so dass eine Suche nach
 +neuen Wirkstoffen gezielt erfolgen muss und sich auf einen möglichst kleinen, ​
 +relevanten Teil beschränken sollte. Entsprechende Datensätze von chemischen ​
 +Strukturen werden in sogenannten Substanzbibliotheken zusammengefasst und können
 +experimentell in Hochdurchsatzverfahren auf ihre Eignung als Wirkstoff getestet werden.
 +
 +Auch wenn einige Kriterien für eine automatisierte Vorauswahl herangezogen werden können, setzt die Bewertung ​
 +der biologischen Wirksamkeit zur Auswahl von Wirkstoffkandidaten Expertenwissen
 +über komplexe biochemische Zusammenhänge voraus. Dazu wird eine möglichst vollständige ​
 +Übersicht der schon bekannten Eigenschaften einer Substanz sowie deren bestehender Ähnlichkeiten zu bereits
 +untersuchten Molekülen benötigt.
 +Die Integration und geeignete visuelle Aufbereitung der zur Verfügung stehenden Daten im
 +Rahmen von Softwaretools kann den Analyseprozess für den Experten wesentlich vereinfachen
 +und beschleunigen.
 +Konzepte zur sinnvollen Ordnung des Strukturraums und ihre graphische Visualisierung
 +sind dabei ein geeignetes Hilfsmittel.
 +Waldmann et al. haben ein Konzept zur Klassifikation der Moleküle eines 
 +Datensatzes und ihre Einordnung in einen hierarchischen Strukturgerüstbaum ​
 +entwickelt. Dabei werden Moleküle mittels Methoden der //​Chemoinformatik//​ chemisch sinnvollen Strukturgerüsten,​ den sogenannten //​Scaffolds//,​ zugeordnet, die wiederum schrittweise ​ vereinfacht werden indem sukzessiv Ringe der Struktur entfernt werden. Hieraus ergibt sich
 +eine Vielzahl von Elter-Kind-Beziehungen,​ die sich zu einem Baum zusammenfassen
 +lassen. ​
 +
 +Mit der Software [[http://​scaffoldhunter.sourceforge.net|Scaffold Hunter]] wurde bereits einmal
 +auf Grundlage dieses Konzepts ein Navigationstool in einer Projektgruppe
 +(PG504 ChemBioSpacE) erfolgreich umgesetzt. Der Scaffold Hunter erlaubt
 +die interaktive Visualisierung eines Strukturgerüstbaum und dadurch die 
 +intuitive Navigation im chemischen Strukturraum. Hierbei wird die Baumstruktur zuvor 
 +nach einem festen Regelsatz berechnet und in einer Datenbank gespeichert.
 +Einen vergleichbaren Ansatz verfolgt die Software [[http://​molwind.sourceforge.net|Molwind]],​ wobei die Visualisierung auf der Open Source Software [[http://​worldwind.arc.nasa.gov|NASA World Wind]] beruht und Methoden aus der Kartographie und der Geoinformatik zur Navigation im Strukturraum eingesetzt ​
 +werden. Die positive Rückmeldung zu solchen Konzepten von Forschungsgruppen und der pharmazeutischen Industrie motiviert zu einer Weiterentwicklung der Ansätze.
 +
 +Die Festlegung auf ein einziges Konzept zur Klassifikation des Strukturraums
 +schränkt die Nutzbarkeit der Software jedoch ein. Einige Ordnungskonzepte
 +erscheinen für bestimmte Fragestellungen optimal, unterstützen andere
 +Anwendungsfälle jedoch möglicherweise nur unzureichend. Daraus resultiert der 
 +Wunsch nach einer flexiblen Ordnung des Strukturraums,​ die je nach Fragestellung ​
 +gewählt werden kann.
 +
 +Der Nutzen derartiger Software kann zudem wesentlich von der Verknüpfung der Moleküle mit
 +zusätzlichen Informationen profitieren. Dazu zählen beispielsweise ​
 +die chemischen Eigenschaften eines Moleküls, ihre Fähigkeit an bestimmte Proteine
 +zu binden, die diesbezügliche Selektivität,​ ihre Verfügbarkeit sowie bekannte pharmazeutische Wirkungen.
 +Sinnvolle Konzepte für das Knowledge Management, also Methodiken, die den möglichst
 +effizienten Umgang mit diesen Daten erlauben, werden sowohl von der Forschung
 +als auch der Industrie als extrem wichtig angesehen und bilden einen Pfeiler ​
 +der von der EU und der pharmazeutischen Industrie zusammen angestoßenen [[http://​imi.europa.eu|Innovative
 +Medicine Initiative]].
 +Auch wenn das Wissen über die Beziehung zwischen Eigenschaften der Moleküle und
 +ihrer Wirkung teilweise noch lückenhaft ist, und zu einem großen Bereich des
 +chemischen Strukturraums noch gar keine Informationen vorliegen, so ist doch
 +bereits eine große Anzahl von Molekülen gut untersucht. ​
 +Während derartige Daten lange Zeit schwer zugänglich waren, werden die resultierenden
 +Ergebnisse mittlerweile systematisch in Datenbanken gespeichert und mit Projekten
 +wie z.B. [[http://​pubchem.ncbi.nlm.nih.gov|PubChem]] oder [[http://​www.ebi.ac.uk/​chebi|ChEBI]] stehen inzwischen zahlreiche freie, öffentliche Datenbanken zur Verfügung.
 +Die für typische Fragestellungen benötigten Daten liegen aber unter Umständen verstreut ​
 +vor und sind nicht gut untereinander verknüpft. Zusätzlich müssen üblicherweise sowohl
 +lokale Datenbanken (mit noch vertraulichen Daten) und öffentlich zugängliche Datenbanken
 +zusammen betrachtet werden. Die Schwierigkeit besteht derzeit also darin, relevante
 +Informationen unterschiedlicher Datenbanken zusammenzuführen (//​Datenintegration//​),​ auszuwerten,​ auf angemessene
 +Weise zu repräsentieren und dadurch erfassbar zu machen. Hier soll die Projektgruppe
 +Lösungen entwickeln und umsetzen, die es zum Beispiel ermöglichen,​ Eigenschaften von Molekülen
 +vorherzusagen,​ oder vielversprechende aber noch nicht synthetisierte Moleküle in der Substanzbibliothek
 +zu finden.
 +
 +==== Aufgabenstellung ====
 +
 +Die wenigen bereits existierenden Navigationstools bieten keine
 +Schnittstelle für die Einbindung von im Internet verfügbaren Wissensressourcen,​ sondern
 +erlauben nur die Repräsentation der Daten aus einer einzelnen Datenbank. In der Projektgruppe
 +soll ein Konzept entwickelt und umgesetzt werden, das es erlaubt, unterschiedliche Datenquellen
 +in Software zur visuellen Analyse von chemischen Moleküldatenbanken zu integrieren. Dazu soll
 +ein flexibles Framework erstellt werden, das es ermöglicht,​ Informationen aus frei verfügbaren Datenbanken ​
 +automatisch mit chemischen Strukturen zu verknüpfen. Dies beinhaltet zum einen die technische ​
 +Unterstützung der Einbindung durch entsprechende Schnittstellen und zum anderen die geeignete graphische Repräsentation.
 +Der großen Vielfalt an möglichen Datenquellen soll dadurch Rechnung getragen werden, dass sich weitere
 +Datenbanken mit geringem Aufwand anbinden lassen.
 +
 +Zusätzlich bauen bestehende Tools auf einer statischen Umsetzung
 +einer spezifischen Molekülklassifikation auf, die jeweils nur einen kleinen Bereich der
 +möglichen Fragestellungen abdeckt. ​
 +Um die aus den Datenquellen bezogenen Informationen sinnvoll bei der Suche nach
 +Wirkstoffen einsetzen zu können, müssen sie einerseits angemessen visuell repräsentiert
 +werden, und andererseits sinnvoll in die 
 +Navigationsmechanismen integriert werden.
 +Während zum Beispiel bisher die Navigation über einen statisch generierten ​
 +Strukturgerüstbaum erfolgt, der rein auf strukturell begründeten Eltern-Kind-Beziehungen
 +beruht, kann die Einbindung zusätzlicher Daten zu einer flexiblen und benutzerdefinierte
 +Erstellung von Molekülrelationen genutzt werden.
 +Für eine erste Erweiterung kann der in Scaffold Hunter integrierte Ansatz verwendet ​
 +werden, wobei Elter-Kind-Beziehungen auf unterschiedliche Weise nach benutzerdefinierten ​
 +Regeln bestimmt werden.
 +Darüber hinaus sollen statistische Verfahren wie die Clusteranalyse verwendet ​
 +werden, um dynamisch eine Klassifikation der Strukturen zu berechnen. Die Ergebnisse ​
 +müssen geeignet visualisiert werden und eine interaktive Navigation in den Daten 
 +soll unterstützt werden. Die Clusteranalyse soll auf Basis verschiedener Eigenschaften der 
 +chemischen Strukturen durchgeführt werden, die vom Nutzer spezifiziert werden.
 +Dazu sollen Informationen unterschiedlicher Datenquellen gewählt werden können.
 +
 +Bei der Umsetzung der Konzepte muss daran gedacht werden, dass die Software für
 +Anwender aus den Bereichen Chemie und Biologie gedacht ist, und die Interaktion mit
 +der Nutzeroberfläche möglichst intuitiv vonstatten gehen soll. Eine zusätzliche ​
 +Herausforderung ist das Volumen der zu verarbeitenden Daten. Hier müssen
 +ausreichend effiziente Algorithmen und Methoden gewählt und unter Berücksichtigung
 +des Ressourcenverbrauchs entsprechend umgesetzt werden.
 +
 +
 +
 +===== Anforderungen =====
 +==== Teilnahmevoraussetzungen ====
 +  * Programmiererfahrung in Java (V)
 +  * Mensch-Maschine-Interaktion **oder** Effiziente Algorithmen **oder** Datenvisualisierung **oder** Automatisches Zeichnen von Graphen (M)
 +  * Webtechnologien **oder** Wissensentdeckung in Datenbanken (W)
 +
 +**Legende:​** (M) Mindestens eine; (V) Voraussetzung;​ (W) Wünschenswert
 +
 +Es werden keine Vorkenntnisse aus der Chemie benötigt.
 +
 +
 +==== Minimalziele ====
 +  - Entwurf und Implementierung eines Frameworks zur Integration von zusätzlichen Informationen,​ das mindestens zwei externe sowie eine lokale Datenquellen umfasst und die beispielhafte Integration in Scaffold Hunter.
 +  - Verknüpfung der Informationen mit den Strukturen im Programm, angemessene Aufbereitung und Darstellung.
 +  - Implementierung weiterer Konzepte der Klassifikation und Navigation im chemischen Strukturraum sowie ihre Visualisierung.
 +    * Erweiterung des bestehenden Konzepts statischer Strukturgerüstbäume.
 +    * Anwendung statistischer Methoden zur Klassifikation des Strukturraums.
 +
 +===== Material =====
 +==== Literatur ====
 +== Chemoinformatik,​ Grundlagen ==
 +  * //​Chemoinformatics - an introduction for computer scientists.//​\\ Nathan Brown; ACM Computing Surveys, Volume 41, Issue 2 (February 2009).
 +  * //Chemical space and biology.//​\\ Christopher M. Dobson; Nature, Volume 432, No. 7019. (15 December 2004), pp. 824-828.
 +== Scaffold Tree Konzept ==
 +  * //The Scaffold Tree - Visualization of the Scaffold Universe by Hierarchical Scafold Classification.//​\\ Schuffenhauer,​ A., P. Ertl, S. Roggo, S. Wetzel, M. A. Koch und H. Waldmann; J. Chem. Inf. Modelling, 47(1):​47–58,​ January 2007.
 +  * //Staring off into chemical space.//\\ Irwin, John J.; Nature Chemical Biology, 5(8):​536–537,​ August 2009.
 +  * //​Bioactivity-guided mapping and navigation of chemical space.//\\ Renner, Steffen, Willem A. L. van Otterlo, Marta Dominguez Seoane, Sabine Mocklinghoff,​ Bettina Hofmann, Stefan Wetzel, Ansgar Schuffenhauer,​ Peter Ertl, Tudor I. Oprea, Dieter Steinhilber,​ Luc Brunsveld, Daniel Rauh und Herbert Waldmann; Nature Chemical Biology, 5(8):​585–592,​ June 2009.
 +  * //A Scaffold-Tree-Merging Strategy for Prospective Bioactivity Annotation of gamma-Pyrones.//​\\ Wetzel, Stefan, Wolfram Wilk, Samy Chammaa, Bianca Sperl, Anke G. Roth, Aybike Yektaoglu, Steffen Renner, Thorsten Berg, Christoph Arenz, Athanassios Giannis, Tudor I. Oprea, Daniel Rauh, Markus Kaiser und Herbert Waldmann; Angewandte Chemie International Edition, 49(21):​3666–3670,​ 2010.
 +  * //​Bioactivity-guided navigation of chemical space.//\\ Bon, Robin S. und Herbert Waldmann; ​ Accounts of Chemical Research, 2010, 43, 1103-1114
 +
 +== Visualisierung ==
 +  * //​Interactive exploration of chemical space with Scaffold Hunter.//\\ Wetzel, Stefan, Karsten Klein, Steffen Renner, Daniel Rauh, Tudor I. Oprea, Petra Mutzel und Herbert Waldmann; Nature Chemical Biology, 5(8):​581–583,​ August 2009.
 +  * //​Kartographie der Moleküle.//​\\ C. Herhaus und O. Karch; Nachrichten aus der Chemie, 57(10):​1002–1004,​ 2009.
 +  * //iPHACE: integrative navigation in pharmacological space.//\\ Ricard Garcia-Serna,​ Oleg Ursu, Tudor I. Oprea und Jordi Mestres; Bioinformatics,​ 2010 Apr 1;​26(7):​985-6.
 +  * //Data visualization during the early stages of drug discovery.//​\\ Dharmesh Maniyar und Ian Nabney; J. Chem. Inf. Model., 2006, 46 (4), pp 1806–1818.
 +  * //Merging chemical and biological space: Structural mapping of enzyme binding pocket space.//\\ Nils Weskamp, Eyke Hüllermeier,​ Gerhard Klebe; Proteins. 2009 Aug 1;​76(2):​317-30.
 +  * //​Constructing Overview + Detail Dendrogram-Matrix Views.//\\ Jin Chen, Alan M. MacEachren, Donna J. Peuquet; IEEE Transactions on Visualization and Computer Graphics, IEEE Computer Society, 2009, 15, 889-896
 +
 +== Datenintegration ==
 +  * //Data integration:​ challenges for drug discovery.//​\\ David B. Searls; Nature Reviews Drug Discovery 4, 45-58 (January 2005)
 +  * //​Integrating biological databases.//​\\ Lincoln D. Stein; Nature Reviews Genetics 4, 337-345 (May 2003).
 +  * //​Integration of Biological Sources: Current Systems and Challenges Ahead.//\\ Thomas Hernandez, Subbarao Kambhampati;​ SIGMOD Rec., 33(3):​51–60,​ 2004.
 +  * //​Informationsintegration:​ Architekturen und Methoden zur Integration verteilter und heterogener Datenquellen.//​\\ Ulf Leser, Felix Naumann; dpunkt, 2006.
 +  * //Biana: a software framework for compiling biological interactions and analyzing networks.//​\\ García-García J, Guney E, Aragues R, Planas-Iglesias J, Oliva B;  BMC Bioinformatics 2010, 11:​56doi:​10.1186/​1471-2105-11-56.
 +
 +== Datenbanken ==
 +  * //PubChem: a public information system for analyzing bioactivities of small molecules.//​\\ Yanli Wang, Jewen Xiao, Tugba O. Suzek, Jian Zhang, Jiyao Wang, and Stephen H. Bryant; Nucl. Acids Res., 37:​W623–633,​ July 2009.
 +  * //ChEBI: a database and ontology for chemical entities of biological interest.//​\\ Kirill Degtyarenko,​ Paula de Matos, Marcus Ennis, Janna Hastings, Martin Zbinden, Alan Mcnaught, Rafael Alcántara, Michael Darsow, Mickaël Guedj, Michael Ashburner; Nucleic Acids Research, 36 (Database issue):​D344–D350,​ January 2008.
 +
 +
 +==== Links ====
 +  * [[http://​scaffoldhunter.sourceforge.net|Scaffold Hunter Website]]
 +  * [[http://​molwind.sourceforge.net|Molwind Website]]
 +  * [[http://​cgl.imim.es/​iphace/​|iPHACE]]
 +  * [[http://​zusammen.metamolecular.com/​2009/​03/​09/​sixty-four-free-chemistry-databases-serialized|Übersicht über öffentliche Chemie-Datenbanken]]
 +  * [[http://​biokemika.uni-frankfurt.de/​wiki/​Portal:​Bioinformatik/​Datenbanken|Übersicht über Datenbanken mit biochemischen Inhalten]]
 +  * [[http://​sbi.imim.es/​web/​BIANA.php|BIANA]]
 +  * {{:​teaching:​swetzel_pgvortrag_2010.ppt|}}
 +  * [[http://​www.cgl.ucsf.edu/​cytoscape/​chemViz/​index.html|chemViz:​ Cheminformatics Plugin for Cytoscape]]
 +  * [[http://​www.cgl.ucsf.edu/​cytoscape/​cluster/​clusterMaker.html|clusterMaker:​ Creating and Visualizing Cytoscape Clusters]]
  
 
Last modified: 2015-09-11 13:42 (external edit)
DokuWikiRSS-Feed