Βιοπληροφορική Επεξεργασία Βιολογικών δεδομένων με χρήση Python: Εφαρμογή σε δεδομένα NGS
Overview

📚 Σκοπός του προγράμματος είναι η εκπαίδευση των συμμετεχόντων/ουσών στη γλώσσα προγραμματισμού Python με επίκεντρο την επεξεργασία και τη Βιοπληροφορική ανάλυση βιολογικών δεδομένων. Αρχικά, οι εκπαιδευόμενοι/ες θα αποκτήσουν εξοικείωση με τις βασικές έννοιες της Μοριακής Βιολογίας και τα δεδομένα που παράγονται, ώστε στη συνέχεια να είναι δυνατή και η περαιτέρω επεξεργασία τους. Τον κεντρικό πυρήνα του προγράμματος αποτελεί η εκμάθηση της γλώσσας Python με έμφαση στις ιδιαιτερότητες της, τις βασικές δομές, τις συναρτήσεις, καθώς και την επεξεργασία αρχείων που οδηγούν στην ανάπτυξη προγραμμάτων βιοπληροφορικού ενδιαφέροντος.

Τα δεδομένα αποτελούν τον θεμέλιο λίθο της Βιοπληροφορικής ανάλυσης. Θα παρουσιαστούν οι δημοφιλέστερες προγραμματιστικές μέθοδοι προσπέλασης και ανάκτησης δεδομένων στα αποθετήρια βιολογικών δεδομένων (NCBI,ENSEMBL,UCSC κ.α.) από τις εν λόγω βάσεις με τη χρήση βιβλιοθηκών Python, αλλά και βοηθητικών προγραμματιστικών διεπαφων (APIs) που διαθέτουν.

Τα δεδομένα είναι αποθηκευμένα σε πλήθος διαφορετικών γραμμογραφήσεων (format). Οι εκπαιδευόμενοι/ες θα γνωρίσουν τις κυριότερες γραμμογραφήσεις αρχείων αποθήκευσης βιολογικών δεδομένων (SRA, FASTA, SAM, BAM, BED, VCF, GFF, GTF). Επιπλέον, θα παρουσιαστεί αναλυτικά ο προγραμματιστικός τρόπος και οι τεχνικές ανάγνωσης/ επεξεργασίας/ τροποποίησης/αποθήκευσης αυτών των τύπων αρχείων.

Επιπλέον, οι συμμετέχοντες/ουσες θα γνωρίσουν:

  • Το λειτουργικό σύστημα Linux. Συγκεκριμένα, θα παρουσιαστούν οι απαραίτητες γνώσεις και εντολές για την εργασία στα κελύφη (shells), τη διαχείριση/επεξεργασία αρχείων βιοπληροφορικής και την εγκαθίδρυση βιοπληροφορικών ροών.

  • Το περιβάλλον ανάπτυξης Python, Visual Studio Code και των απαραίτητων plugins. Επίσης, την εγκατάσταση και χρήση του περιβάλλοντος Anaconda και ιδιαιτέρως του καναλιού Bioconda για την εγκατάσταση βιοπληροφορικών βιβλιοθηκών και εργαλείων.

  • Βοηθητικά πλαίσια (pandas, numpy, Biopython, pySam, pyBigWig, κ.α.) που ενσωματώνουν λειτουργικότητα για βιοπληροφορικές εργασίες και επιταχύνουν την υλοποίηση προγραμμάτων.

  • Τη δημιουργία διαγραμμάτων στατιστικής απεικόνισης.

  • Την κλήση εξωτερικών προγραμμάτων μέσα από την γλώσσα Python και τη δημιουργία ροών επεξεργασίας πολλαπλών βημάτων.

  • Αλγορίθμους βιοπληροφορικής, οι οποίοι βασίζονται στις αρχές του δυναμικού προγραμματισμού.

Επιπροσθέτως, στο πρακτικό τμήμα που συνοδεύει κάθε ενότητα, θα χρησιμοποιηθεί η γλώσσα Python και πλήθος υποστηρικτικών βιβλιοθηκών για την ανάπτυξη του απαραίτητου κώδικα. Όπου απαιτείται, θα παρατίθεται  ενδεικτικός λειτουργικός κώδικας.

Τι θα μάθεις

Να αναγνωρίζεις και να παρουσιάζεις τις θεμελιώδεις αρχές της Μοριακής Βιολογίας που είναι απαραίτητες για την επίλυση βιολογικών προβλημάτων με τη χρήση βιοπληροφορικών μεθόδων.

Να αναπτύσσεις βασικά προγράμματα γενικής χρήσης αξιοποιώντας τη γλώσσα προγραμματισμού Python.

Να χρησιμοποιείς το λειτουργικό σύστημα Linux για τη διαχείριση αρχείων και την εκτέλεση απαραίτητων διαδικασιών μέσω της γραμμής εντολών, εφαρμόζοντας κατάλληλες εντολές κελύφους.

Να μεταφορτώνεις αρχεία βιολογικών δεδομένων από δημόσια αποθετήρια και να τα διαχειρίζεσαι τοπικά.

Να αξιοποιείς τις εξειδικευμένες δομές δεδομένων της Python για την αποθήκευση και επεξεργασία βιολογικών πληροφοριών.

Να ανοίγεις, να τροποποιείς και να αποθηκεύεις αρχεία βιολογικών δεδομένων, εφαρμόζοντας έτοιμες βιβλιοθήκες (όπως η Biopython) για την αυτοματοποίηση σύνθετων διαδικασιών.

Να εκτελείς εξωτερικά προγράμματα μέσω Python με στόχο την ανάπτυξη ολοκληρωμένων ροών εργασίας (workflows).

Να επεξεργάζεσαι και να αναλύεις μεγάλα δεδομένα που προκύπτουν από πειράματα Μοριακής Βιολογίας.

Να σχεδιάζεις και να υλοποιείς ροές ανάλυσης δεδομένων επόμενης γενιάς αλληλούχισης (NGS), όπως RNA-Seq και DNA-Seq.

Να συνδυάζεις κώδικα που αναπτύσσεις σε Python με υπάρχουσες βιβλιοθήκες ή αυτόνομα εργαλεία τρίτων, ενσωματώνοντάς τα σε διαδικαστικές ροές εργασίας.

Να οπτικοποιείς και να ερμηνεύεις στατιστικά χαρακτηριστικά των βιολογικών δεδομένων μέσω κατάλληλων μεθόδων και εργαλείων.

Διδακτέα Ύλη
  • Δημιουργία περιβάλλοντος ανάπτυξης βιοπληροφορικών προγραμμάτων και εισαγωγή στην μοριακή Βιολογία και τα αποθετήρια βιολογικών δεδομένων
  • Εισαγωγή στο λειτουργικό σύστημα Linux και στη γλώσσα προγραμματισμού Python. Δομές δεδομένων, συναρτήσεις και ενσωματωμένες βιβλιοθήκες για την επεξεργασία βιολογικών δεδομένων
  • Χρήσιμα εργαλεία/βιβλιοθήκες της Python για επεξεργασία βιολογικών δεδομένων και δημιουργία διαγραμμάτων
  • Προχωρημένα θέματα βιοπληροφορικής. Επεξεργασία αρχείων βιολογικών δεδομένων, κλήση εξωτερικών αυτόνομων προγραμμάτων και δημιουργία ροών επεξεργασίας καθώς και εξειδικευμένοι αλγόριθμοι
Instructor
Αρχική Τιμή Mαθήματος
500,00€
Περιλαμβάνει
  • Συνολικός χρόνος ενασχόλησης: 120 ώρες
  • Online μαθήματα με τους εκπαιδευτές: 26 ώρες
  • Διάρκεια: 3,5 μήνες
  • Επωφεληθείτε από τις εκπτώσεις στα δίδακτρα έως 35%
  • 🎓 Απονέμεται Πιστοποιητικό Επιμόρφωσης
Durations: 120 hour
Διαλέξεις: 13
Maximum Students: 1000
Skill level: intermediate
Certificate: yes