Bibliothéque d'alignement global de séquences
Ce projet a été développé durant mes études en DESS Bioinformatique de Lille (Lille1).
Le Projet
Le but de ce projet est de développer un bibliothéque pour l'alignement global de deux séquences génétiques. Cette bibliothéque est utilisé dans le langage C. Cette bibliothéque est utilisé dans un autre projet dans le langage Java. L'idée est d'interfacer Java et C, pour avoir un programme rapide (pour le calcul) grâce aux capacités du langage C. Le sujet du projet est disponible ici.
Découpage du projet
Le projet est composé de deux versions :
- La première version du projet est d'implémenter un méthode simple avec une fonction de gap linéaire. Les côuts d'ouverture et d'extension sont les mêmes.
- La seconde version du projet implémente un méthode avec une fonction de gap affine. Les coûts d'ouverture et d'extension de gap sont donc différents.
Fichiers
Les fichiers du projets sont disponibles ici. Lisez le fichier README pour l'installation.
Le projet est composé de différents sous répertoires :
- src, répertoire contenant les fichiers sources du projet;
- build, répertoire contenant les fichiers compilés;
- test, répertoire contenant des fichiers d'exemple, pour tester le projet ( matrices de substitution, séquence au format fasta);
ainsi que différents fichiers, à la racine du projet:
- align(.exe) l'exécutable du projet, utilisant l'algorithme d'alignement;
- README, fichier contenant diverses informations sur le projet et comment l'utiliser;
- TODO, modifications à apporter au projet;
- Makefile, fichier permettant d'automatiser la compilation su projet.
Démonstation du projet
Exemple:
align globalignlinear -10 -2 substitution.matrix query.fasta target.fasta
Résultat (manquant)