Βιοπληροφορική Επεξεργασία Βιολογικών δεδομένων με χρήση Python: Εφαρμογή σε δεδομένα NGS

Σκοπός του προγράμματος είναι η εκπαίδευση των συμμετεχόντων/ουσών στην γλώσσα Python, με επίκεντρο την επεξεργασία και τη Βιοπληροφορική ανάλυση βιολογικών δεδομένων. Οι εκπαιδευόμενοι/ες αρχικά θα εξοικειωθούν με τις απαραίτητες έννοιες της Μοριακής Βιολογίας και τα δεδομένα που παράγονται, ώστε να είναι δυνατή ή περαιτέρω επεξεργασία τους. Τον κεντρικό πυρήνα αποτελεί η εκμάθηση της γλώσσας Python με έμφαση στις ιδιαιτερότητες της γλώσσας, τις βασικές δομές, τις συναρτήσεις, την επεξεργασία αρχείων που οδηγούν στην ανάπτυξη προγραμμάτων βιοπληροφορικού ενδιαφέροντος.
Τα δεδομένα αποτελούν τον θεμέλιο λίθο της Βιοπληροφορικής ανάλυσης. Θα παρουσιαστούν οι δημοφιλέστερες προγραμματιστικές μέθοδοι προσπέλασης και ανάκτησης δεδομένων στα αποθετήρια βιολογικών δεδομένων (NCBI,ENSEMBL,UCSC κ.α) από τις εν λόγω βάσεις με τη χρήση βιβλιοθηκών Python αλλά και βοηθητικών προγραμματιστικών διεπαφων (APIs) που διαθέτουν.
Τα δεδομένα είναι αποθηκευμένα σε πλήθος διαφορετικών γραμμογραφήσεων (format). Οι εκπαιδευόμενοι/ες θα γνωρίσουν τις κυριότερες γραμμογραφήσεις αρχείων αποθήκευσης βιολογικών δεδομένων (SRA, FASTA, SAM, BAM, BED, VCF, GFF, GTF κτλ) . Θα παρουσιαστεί αναλυτικά ο προγραμματιστικός τρόπος και τεχνικές ανάγνωσης/ επεξεργασίας/ τροποποίησης/αποθήκευσης αυτών των τύπων αρχείων.
Επιπλέον, οι συμμετέχοντες/ουσες θα γνωρίσουν:
Α)Το λειτουργικό σύστημα Linux. Θα παρουσιαστούν οι απαραίτητες γνώσεις και εντολές για την εργασία στα κελύφη (shells), τη διαχείριση/επεξεργασία αρχείων βιοπληροφορικής και την εγκαθίδρυση βιοπληροφορικών ροών.
Β)Το περιβάλλον ανάπτυξης Python, Visual_Studio_Code και των απαραίτητων plugins. Επίσης την εγκατάσταση και χρήση του περιβάλλοντος Anaconda και ιδιαιτέρως του καναλιού Bioconda για την εγκατάσταση βιοπληροφορικών βιβλιοθηκών και εργαλείων.
Γ)Βοηθητικά πλαίσια (όπως panda, numpy, bioPython, pySam, pyBigWig κ.α) που ενσωματώνουν λειτουργικότητα για βιοπληροφορικές εργασίες, επιταχύνοντας την υλοποίηση προγραμμάτων.
Δ)Τη δημιουργία διαγραμμάτων στατιστικής απεικόνισης.
Ε)Την κλήση εξωτερικών προγραμμάτων μέσα από Python και την δημιουργία ροών επεξεργασίας πολλαπλών βημάτων.
Ζ) Αλγορίθμους βιοπληροφορικής βασιζόμενους στις αρχές του δυναμικού προγραμματισμού.
Στο πρακτικό τμήμα που συνοδεύει κάθε ενότητα, θα χρησιμοποιηθεί η γλώσσα Python και πλήθος υποστηρικτικών βιβλιοθηκών για την ανάπτυξη του απαραίτητου κώδικα. Όπου απαιτείται θα παρατίθεται ενδεικτικός λειτουργικός κώδικας
-
Δημιουργία περιβάλλοντος ανάπτυξης βιοπληροφορικών προγραμμάτων και εισαγωγή στην μοριακή Βιολογία και τα αποθετήρια βιολογικών δεδομένων
-
Εγκατάσταση περιβάλλοντος ανάπτυξης βιοπληροφικών προγραμμάτων σε Linux, Python, Conda και απαραίτητων βιβλιοθηκών και λοιπού λογισμικού
-
Εισαγωγή στη βιοπληροφορική και τη μοριακή βιολογία
-
Βιολογικά Αποθετήρια Δεδομένων – Βάσεις δεδομένων, πρόσβαση, πλοήγηση και προγραμματιστικές διεπαφές
-
-
Εισαγωγή στο λειτουργικό σύστημα Linux και στη γλώσσα προγραμματισμού Python. Δομές δεδομένων, συναρτήσεις και ενσωματωμένες βιβλιοθήκες για την επεξεργασία βιολογικών δεδομένων
-
Εισαγωγή στο λειτουργικό σύστημα Linux και το κέλυφος αλληλεπίδρασης γραμμής εργασιών
-
Python μέρος 1 (Δομή γλώσσας, indentation μεταβλητές, τύποι, δομές δεδομένων)
-
Python μέρος 2 (Σύστημα αρχείων, Εξοδος, Αρχεία κειμένου, άνοιγμα, εγγραφή, ανάγνωση, γράψιμο, csv tab αρχεία)
-
-
Χρήσιμα εργαλεία/βιβλιοθήκες της Python για επεξεργασία βιολογικών δεδομένων και δημιουργία διαγραμμάτων
-
Διαγράμματα σε Python
-
Χρήσιμα εργαλεία για βιοπληροφορική επεξεργασία 1: BioPython, Pantas, Numpy, Pysam, PyBigWig, PyVCF, HTSeq
-
Χρήσιμα εργαλεία για βιοπληροφορική επεξεργασία 2: Pantas, Numpy, Pysam, PyBigWig, PyVCF, HTSeq
-
-
Προχωρημένα θέματα βιοπληροφορικής. Επεξεργασία αρχείων βιολογικών δεδομένων, κλήση εξωτερικών αυτόνομων προγραμμάτων και δημιουργία ροών επεξεργασίας καθώς και εξειδικευμένοι αλγόριθμοι
-
Κλήση εξωτερικών προγραμμάτων μέσω Python
-
Ειδικό Μέρος – Ροές επεξεργασίας βιοπληροφορικών δεδομένων
-
Δυναμικός προγραμματισμός και εξειδικευμένοι αλγόριθμοι Βιοπληροφορικής
-
Ειδικά συνδυαστικά θέματα
-
- Συνολικός χρόνος ενασχόλησης: 120 ώρες
- Online μαθήματα με τους εκπαιδευτές: 26 ώρες
- Διάρκεια: 3,5 μήνες
- Επωφεληθείτε από τις εκπτώσεις στα δίδακτρα έως 35%
- 🎓 Απονέμεται Πιστοποιητικό Επιμόρφωσης