Les journées SeqBio sont les journées francophones annuelles communes au GDR BIM (bioinformatique moléculaire) et au groupe COMATEGE du GDR IM (informatique mathématique). Cette réunion s’adresse aux chercheurs en informatique, statistique, bio-informatique et biologie qui travaillent sur les séquences, vues comme objet combinatoire ou comme objet biologique.
Ces journées sont organisées annuellement et ont eu lieu les années précédentes à Nantes, Orsay, Montpellier.
Comme chaque année depuis 2011, nous aurons des orateurs invités. Cette année il s'agira de Knut Reinert de l'université libre de Berlin ainsi que Céline Scornavacca, CNRS, ISEM, Montpellier.
Vous pouvez trouver une liste d'hôtels disponibles sur le site de l'office de tourisme de Lille
Les journées se tiendront sur le campus de l'université Lille 1, à Villeneuve d'Ascq, dans l'amphithéâtre Migeon du bâtiment Polytech'Lille.
Pour venir sur le campus, le
plus simple est de venir en
métro en prenant la ligne
, jusqu'au
terminus 4 cantons (compter
au total 30 minutes depuis
la gare Lille Flandres).
Les résumés peuvent être téléchargés ici.
10h25 10h50 | Accueil |
10h50 10h55 | Introduction |
10h55 11h25 | De novo reference-based read correction (slides) |
11h25 11h55 | Scaffolding with Contig Repetition (slides) |
11h55 12h25 | Clustering with proximity graphs for metagenomic binning |
12h25 12h55 | Locality-sensitive hashing indexing schemes for compositional assembly-free metagenomics data |
12h55 14h15 | Déjeuner |
14h15 15h15 | Comprehensive gene tree-species tree reconciliation using parsimony... and more (slides) |
15h15 15h45 | Development of indexing compressed structure for analyzing a collection of similar genomes: application to rice (slides) |
15h45 16h15 | An exploration on the size of the neighborhood of a word (slides) |
16h15 16h45 | Pause |
16h45 17h15 | Dichotomic search and searching in a table of strings: Average number of symbol comparisons |
16h45 17h15 | Unfoldable self-avoiding walks (slides) |
09h15 10h15 | Engineering meets biomedicine. (slides) |
10h15 10h45 | Efficient pattern matching in degenerate strings with the Burrows–Wheeler transform (slides) |
10h45 11h15 | Pause |
11h15 11h45 | Normal sequences, sequences of complexity 2n+1 and continued fractions algorithms (slides) |
11h45 12h15 | Complexité et aspects énumératifs du design multiple d'ARN (slides) |
12h15 13h00 | Discussions |
13h00 14h30 | Déjeuner |
14h30 15h00 | De novo Clustering of Gene Expression in Transcriptomic Long Reads Data Sets (slides) |
15h00 15h30 | HG-CoLoR: enHanced de bruijn Graph for the error COrrection of LOng Reads (slides) |
15h30 16h00 | Debugging long-read genome assemblies using string graph analysis (slides) |
16h00 16h30 | Assembling heterozygous genomes: are long reads the panacea? (slides) |
16h30 17h00 | Pause et au-revoirs |
Nous aurons deux exposés invités :
Gene trees and species trees can be discordant due to several biological processes. In this talk I will review and present applications for standard models of gene tree-species tree reconciliation (the DL and DTL models) that take into account macro-evolutionary events at the gene level such as duplications, losses and transfers of genes. I will also introduce two recent reconciliation models: (1) a unified formal IDTL reconciliation model, including the above mentioned processes and taking incomplete lineage sorting (ILS) in the species tree into account, and (2) a DTL model in which the species phylogeny is a network rather than a tree.
Bioinformatics has matured during the last 10 years and combines now many aspects of algorithmics, combinatorics, and computer science. At the same time biomedical research is becoming more and more data driven and many analysis need timely analysis of genomic data. In addition, it is quite apparent that the available compute infrastructure evolves towards the use of hardware acceleration in form of many-core systems that have large vector units. Consequently, we have to adapt our algorithms and implementations such that they are able to take advantage of this development and provide the tools for the new precision medicine. I will introduce the research focus of my group, which is to bridge the gap between biomedical, experimental researchers and the computer science community. The main focus lies in the development of the C++ algorithms library SeqAn. I will talk about its design and our roadmap to support vectorization and multi-core processing. I will then exemplify the benefits using one well-known bioinformatics algorithm, pairwise sequence alignment, and a novel work of my group introducing an efficient method and implementation for constant time bidirectional search using FM-indices requiring only the BWT and some small support data structures and point out what tools for biomedical research can benefit from this.
Rayan Chikhi | CNRS, CRIStAL, Université de Lille |
Stéphane Janot | CRIStAL, Université de Lille |
Laurent Noé | CRIStAL, Université de Lille |
Mikaël Salson | CRIStAL, Université de Lille |
Hélène Touzet | CNRS, CRIStAL, Université de Lille |
Rayan Chikhi | CNRS, CRIStAL, Université de Lille |
Alain Denise | LRI et IGM, Université Paris-Sud |
Vincent Lacroix | LBBE, Université Lyon 1 |
Thierry Lecroq | LITIS, Université de Rouen |
Laurent Noé | CRIStAL, Université de Lille |
Irena Rusu | LINA, Université de Nantes |
Mikaël Salson | CRIStAL, Université de Lille |
Hélène Touzet | CNRS, CRIStAL, Université de Lille |
Raluca Uricaru | LaBRI, Université de Bordeaux |
Stéphane Vialette | CNRS, LIGM, Université Paris Est |
Les soumissions se faisaient via EasyChair au format PDF.
Deux types de soumissions étaient acceptés : résumé court (≤ 2 pages) ou étendu (il n'y a pas de limite ferme mais de préférence ≤ 8 pages). Des modèles LaTeX ou traitement de texte sont disponibles. Le texte peut être rédigé en français ou en anglais. Pour les présentations, toutefois, il serait bienvenu que, par bienveillance envers les personnes non francophones, les transparents soient en anglais.