Géraud GOURJON & Anna DEGIOANNI ![]() Contact: ![]() ![]() |
Several estimators have been developped to estimate parental population contributions to the genetic pool of an admixed population (see Degioanni et Gourjon 2010 for a review of around 40 methods). Some of them have been implemented in software programs, allowing a more or less easy estimation. A complete study of these methods and associated software (Gourjon 2010; Gourjon et al. 2010) highlight some limits in their reliability and their applicability.
It seems to be primary to estimate admixture rates using several admixture estimation software, and to use several parental population combinations to highlight regional variation in admixture dynamics (see Gourjon et al. 2010). Additionnally, to estimate efficiently the admixture rates, to use all the available genetic markers appears to be mandatory as well. However, each software program has its own input file format and it is a tedious work to complete dozens of input files for each one.
The six most commonly used software programs in the literature for population genetic admixture estimation since
20 years, are ADMIX, ADMIX95, Mistura, Admix 2.0, LEA, and LEADMIX. We present a specific tool that can help in the file creation process: AdFiT (Admixture Files Tool) version 1.7, a multi-language software (English, French and Spanish). Starting from a common file containing data, it allows to instantaneously create input files for these software programs and two others, Parallel LEA (ParLEA) and Mixtur.
AdFiT is freely available online for academic users. The v2.0 will be available soon and will include some new estimators of admixture.
Keywords: genetic admixture, human population, admixture rates, software tool.
Plusieurs estimateurs des contributions relatives des populations parentales à la population mélangée ont été proposés
par différentes méthodes (Voir Degioanni et Gourjon, 2010 pour une revue d'une quarantaine de méthodes). Ces dernières ont pour la plupart été implantées dans des logiciels permettant d’estimer de manière (parfois)
rapide et plus ou moins précise les contributions de chacune des ces populations. Cependant après une approche approfondie de plusieurs de ces logiciels (Gourjon 2010; Gourjon et al. 2010), il ressort que leur fiabilité
et leur applicabilité sont souvent faibles. De plus, leur utilisation est pour certains peu aisée et les résultats obtenus pas toujours exploitables. Il nous semblait primordial afin d’estimer
de manière plus pertinente les taux de mélange, d’avoir recours simultanément à plusieurs logiciels et plusieurs types de marqueurs. Cependant la création des fichiers d’entrée pour
ces logiciels peut se montrer fastidieuse lorsque beaucoup de fichiers d’entrée doivent être réalisés (combinaison entre populations parentales, entre loci, pour différents marqueurs,
pour les divers paramètres intrinsèques au logiciel, etc.). Il était donc nécessaire d’avoir un outil d’aide à la création de ces fichiers pour l’ensemble des logiciels les plus utilisés dans les
publications. Nous avons donc développé un logiciel permettant à partir d’un fichier général d’obtenir directement les fichiers dans les formats ADMIX (Long 1991), ADMIX95
(Chakraborty 1985, Bertoni 1995), Mistura (Krieger et al. 1965, Krieger et Cabello 1997), Admix2.0 (Bertorelle et Excoffier 1998, Dupanloup et Bertorelle 2001), LEA
(Chikhi et al. 2001, Langella et al. 2001), Parallel LEA (Giovannini et al. 2009), Mixtur (Wijsman 1984) et LEADMIX (Wang 2003). Ceci permettra à terme d’utiliser rapidement l’intégralité des logiciels et d’avoir une vue holistique du mélange génétique.
La version 2.0 sera bientôt disponible est permettra d'avoir une estimation rapide des taux de mélange basés sur les distances génétiques, selon la méthode de Cavalli-Sforza (1994).
BIBLIOGRAPHIE/REFERENCE
- Bertoni B. 1995. ADMIX95.
- Bertorelle G, and Excoffier L. 1998. Inferring admixture proportions from molecular data. Mol Biol Evol 15(10):1298-1311.
- Cabello P, and Krieger H. 1997. GENIOC: Sistema para análises de dados de genética. Rio de Janeiro: FIOCRUZ.
- Cavalli-Sforza L, Menozzi P, and Piazza A. 1994. The History and Geography of Human Genes. Princeton, New Jersey: Princeton University Press. 1088 p.
- Chakraborty R. 1985. Gene identity in racial hybrids and estimation of admixture rates. In: JV AYaN, editor. Genetic differentiation in human and other animal populations. Delhi: Indian Anthropological Association.
- Chikhi L, Bruford M, and Beaumont M. 2001. Estimation of admixture proportions: a likelihood-based approach using Markov chain Monte Carlo. Genetics 158(3):1347-1362.
- Degioanni A, and Gourjon G. 2010. Le mélange dans les populations humaines: modèles et méthodes d'estimation. Anthropologie 48(1):41-56. (In press)
- Dupanloup I, and Bertorelle G. 2001. Inferring admixture proportions from molecular data: extension to any number of parental populations. Mol Biol Evol 18(4):672-675.
- Giovannini A, Zanghirati G, Beaumont M, Chikhi L, and Barbujani G. 2009. A novel parallel approach to the likelihood-based estimation of admixture in population genetics. Bioinformatics 25(11):1440-1441.
- Gourjon G. 2010. L'estimation du mélange génétique dans les populations humaines. Marseille: Université de la Méditerranée, Aix-Marseille II. 297 p.
- Gourjon G, Boëtsch G, and Degioanni A. 2010. Gender and population history: sex bias revealed by studying genetic admixture of Ngazidja population (Comoro Archipelago). Am J Phys Anthropol. In press.
- Gourjon G, and Degioanni A. 2009. AdFiT v1.7 (Admixture File Tool): input files creating tool for genetic admixture estimation software. Bulletins et Mémoires de la Société d'Anthropologie de Paris 21(3-4):223-229.
- Krieger H, Morton N, Mi M, Azevêdo E, Freire-Maia A, and Yasuda N. 1965. Racial admixture in north-eastern Brazil. Ann Hum Genet 29(2):113-125.
- Langella O, Chikhi L, and Beaumont M. 2001. LEA (likelihood-based estimation of admixture): a program to estimate simultaneously admixture and time since the admixture event. Molecular Ecology Notes 1(4):357-358.
- Lathrop G. 1982. Evolutionary trees and admixture: phylogenetic inference when some populations are hybridized. Ann Hum Genet 46(Pt 3):245-255.
- Long J. 1991. The genetic structure of admixed populations. Genetics 127(2):417-428.
- Wang J. 2003. Maximum-likelihood estimation of admixture proportions from genetic data. Genetics 164(2):747-765.
- Wijsman E. 1984. Techniques for estimating genetic admixture and applications to the problem of the origin of the Icelanders and the Ashkenazi Jews. Hum Genet 67(4):441-448.