Βιοπληροφορική Επεξεργασία Βιολογικών δεδομένων με χρήση Python: Εφαρμογή σε δεδομένα NGS
Overview

Σκοπός του προγράμματος είναι η εκπαίδευση των συμμετεχόντων/ουσών στην γλώσσα Python, με επίκεντρο την επεξεργασία και τη Βιοπληροφορική ανάλυση βιολογικών δεδομένων. Οι εκπαιδευόμενοι/ες αρχικά θα εξοικειωθούν με τις απαραίτητες έννοιες της Μοριακής Βιολογίας και τα δεδομένα που παράγονται, ώστε να είναι δυνατή ή περαιτέρω επεξεργασία τους. Τον κεντρικό πυρήνα αποτελεί η εκμάθηση της γλώσσας Python με έμφαση στις ιδιαιτερότητες της γλώσσας, τις βασικές δομές, τις συναρτήσεις, την επεξεργασία αρχείων που οδηγούν στην ανάπτυξη προγραμμάτων βιοπληροφορικού ενδιαφέροντος.

Τα δεδομένα αποτελούν τον θεμέλιο λίθο της Βιοπληροφορικής ανάλυσης. Θα παρουσιαστούν οι δημοφιλέστερες προγραμματιστικές μέθοδοι προσπέλασης και ανάκτησης δεδομένων στα αποθετήρια βιολογικών δεδομένων (NCBI,ENSEMBL,UCSC κ.α) από τις εν λόγω βάσεις με τη χρήση βιβλιοθηκών Python αλλά και βοηθητικών προγραμματιστικών διεπαφων (APIs) που διαθέτουν.

Τα δεδομένα είναι αποθηκευμένα σε πλήθος διαφορετικών γραμμογραφήσεων (format). Οι εκπαιδευόμενοι/ες θα γνωρίσουν τις κυριότερες γραμμογραφήσεις αρχείων αποθήκευσης βιολογικών δεδομένων (SRA, FASTA, SAM, BAM, BED, VCF, GFF, GTF κτλ) . Θα παρουσιαστεί αναλυτικά ο προγραμματιστικός τρόπος και τεχνικές ανάγνωσης/ επεξεργασίας/ τροποποίησης/αποθήκευσης αυτών των τύπων αρχείων.

Επιπλέον, οι συμμετέχοντες/ουσες θα γνωρίσουν:

Α)Το λειτουργικό σύστημα Linux. Θα παρουσιαστούν οι απαραίτητες γνώσεις και εντολές για την εργασία στα κελύφη (shells), τη διαχείριση/επεξεργασία αρχείων βιοπληροφορικής και την εγκαθίδρυση βιοπληροφορικών ροών.

Β)Το περιβάλλον ανάπτυξης Python, Visual_Studio_Code και των απαραίτητων plugins. Επίσης την εγκατάσταση και χρήση του περιβάλλοντος Anaconda και ιδιαιτέρως του καναλιού Bioconda για την εγκατάσταση βιοπληροφορικών βιβλιοθηκών και εργαλείων.

Γ)Βοηθητικά πλαίσια (όπως panda, numpy, bioPython, pySam, pyBigWig κ.α) που ενσωματώνουν λειτουργικότητα για βιοπληροφορικές εργασίες, επιταχύνοντας την υλοποίηση προγραμμάτων.

Δ)Τη δημιουργία διαγραμμάτων στατιστικής απεικόνισης.

Ε)Την κλήση εξωτερικών προγραμμάτων μέσα από Python και την δημιουργία ροών επεξεργασίας πολλαπλών βημάτων.

Ζ) Αλγορίθμους βιοπληροφορικής βασιζόμενους στις αρχές του δυναμικού προγραμματισμού.

Στο πρακτικό τμήμα που συνοδεύει κάθε ενότητα, θα χρησιμοποιηθεί η γλώσσα Python και πλήθος υποστηρικτικών βιβλιοθηκών για την ανάπτυξη του απαραίτητου κώδικα. Όπου απαιτείται θα παρατίθεται  ενδεικτικός λειτουργικός κώδικας

Τι θα μάθεις
Να προσδιορίζεις και παρουσιάζεις τις βασικές αρχές της Μοριακής Βιολογίας που απαιτούνται για την αντιμετώπιση των βιολογικών προβλημάτων με βιοπληροφορικές μεθόδους
Να χρησιμοποιείς την γλώσσα Python για τη δημιουργία απλών προγραμμάτων γενικής χρήσης
Να χρησιμοποιείς το λειτουργικό σύστημα Linux για εργασίες διαχείρισης αρχείων και άλλων απαραίτητων διαδικασιών μέσω της διεπαφής γραμμής εργασιών, χρησιμοποιώντας τις κατάλληλες εντολές κελύφους
Να μεταφορτώνεις αρχεία βιολογικών δεδομένων στον υπολογιστή του από δημόσια αποθετήρια
Να εφαρμόζεις τις ιδιαίτερες δομές της Python για την αποθήκευση και επεξεργασία δεδομένων.
Να επεξεργάζεσαι (ανοίγεις, τροποποιείς, αποθηκεύεις τα αρχεία βιολογικών δεδομένων) και να εφαρμόζεις έτοιμες βιβλιοθήκες (bioPython) για πλήθος άλλων διαδικασιών
Να καλείς ένα ή περισσότερα εξωτερικά προγράμματα μέσα από Python με σκοπό τη δημιουργία μιας ροής εργασιών
Να επεξεργάζεσαι μεγάλα δεδομένα που παράγονται από πειράματα Μοριακής Βιολογίας
Να σχεδιάζεις την απαιτούμενη ροή διαδικασιών, ώστε να διαχειριστείς προβλήματα ανάλυσης δεδομένων NGS (RNA-Seq, DNA-Seq)
Να συνδυάζεις τμήματα κώδικα που αναπτύσσει σε Python με έτοιμα εργαλεία τρίτων (βιβλιοθήκες, αυτόνομα εργαλεία) σε διαδικαστικές ροές
Να οπτικοποιείς στατιστικά χαρακτηριστικά των δεδομένων
Διδακτέα Ύλη
  • Δημιουργία περιβάλλοντος ανάπτυξης βιοπληροφορικών προγραμμάτων και εισαγωγή στην μοριακή Βιολογία και τα αποθετήρια βιολογικών δεδομένων
  • Εισαγωγή στο λειτουργικό σύστημα Linux και στη γλώσσα προγραμματισμού Python. Δομές δεδομένων, συναρτήσεις και ενσωματωμένες βιβλιοθήκες για την επεξεργασία βιολογικών δεδομένων
  • Χρήσιμα εργαλεία/βιβλιοθήκες της Python για επεξεργασία βιολογικών δεδομένων και δημιουργία διαγραμμάτων
  • Προχωρημένα θέματα βιοπληροφορικής. Επεξεργασία αρχείων βιολογικών δεδομένων, κλήση εξωτερικών αυτόνομων προγραμμάτων και δημιουργία ροών επεξεργασίας καθώς και εξειδικευμένοι αλγόριθμοι
Instructor
Αρχική Τιμή Mαθήματος
€500.00
Περιλαμβάνει
  • Συνολικός χρόνος ενασχόλησης: 120 ώρες
  • Online μαθήματα με τους εκπαιδευτές: 26 ώρες
  • Διάρκεια: 3,5 μήνες
  • 📌 Παράταση υποβολής αιτήσεων έως 2 Απριλίου 2024
  • 📅 Έναρξη μαθημάτων: 6 Απριλίου 2024
  • Επωφεληθείτε από τις εκπτώσεις στα δίδακτρα έως 35%
  • 🎓 Απονέμεται Πιστοποιητικό Επιμόρφωσης
Durations: 120 hour
Διαλέξεις: 13
Maximum Students: 1000
Skill level: intermediate
Certificate: yes