Issue |
Parasite
Volume 28, 2021
Special Issue – Combatting Anthelmintic resistance in ruminants. Invited Editors: Johannes Charlier, Hervé Hoste, and Smaragda Sotiraki
|
|
---|---|---|
Article Number | 46 | |
Number of page(s) | 16 | |
DOI | https://doi.org/10.1051/parasite/2021042 | |
Published online | 27 May 2021 |
Research Article
Constraints of using historical data for modelling the spatial distribution of helminth parasites in ruminants
Contraintes liées à l’utilisation de données historiques pour la modélisation de la distribution spatiale des helminthes parasites chez les ruminants
1
Department of Research and Development, Avia-GIS NV, 2980 Zoersel, Belgium
2
CREMOPAR, Department of Veterinary Medicine and Animal Production, University of Naples Federico II, 80138 Naples, Italy
3
Department of Infection Biology and Microbiomes, Institute of Infection, Veterinary and Ecological Sciences, University of Liverpool, L69 7ZX Liverpool, United Kingdom
4
Parasitology Laboratory, Veterinary Research Institute, Hellenic Agricultural Organization DEMETER, 57001 Thessaloniki, Greece
5
Laboratory for Parasitology, Faculty of Veterinary Medicine, Ghent University, 9820 Merelbeke, Belgium
* Corresponding author: ghendrickx@avia-gis.com
Received:
8
October
2020
Accepted:
26
April
2021
Dicrocoelium dendriticum is a trematode that infects ruminant livestock and requires two different intermediate hosts to complete its lifecycle. Modelling the spatial distribution of this parasite can help to improve its management in higher risk regions. The aim of this research was to assess the constraints of using historical data sets when modelling the spatial distribution of helminth parasites in ruminants. A parasitological data set provided by CREMOPAR (Napoli, Italy) and covering most of Italy was used in this paper. A baseline model (Random Forest, VECMAP®) using the entire data set was first used to determine the minimal number of data points needed to build a stable model. Then, annual distribution models were computed and compared with the baseline model. The best prediction rate and statistical output were obtained for 2012 and the worst for 2016, even though the sample size of the former was significantly smaller than the latter. We discuss how this may be explained by the fact that in 2012, the samples were more evenly geographically distributed, whilst in 2016 most of the data were strongly clustered. It is concluded that the spatial distribution of the input data appears to be more important than the actual sample size when computing species distribution models. This is often a major issue when using historical data to develop spatial models. Such data sets often include sampling biases and large geographical gaps. If this bias is not corrected, the spatial distribution model outputs may display the sampling effort rather than the real species distribution.
Résumé
Dicrocoelium dendriticum est un trématode qui infecte les ruminants et nécessite deux hôtes intermédiaires différents pour terminer son cycle de vie. La modélisation de la distribution spatiale de ce parasite peut aider à améliorer sa gestion dans les régions à haut risque. L’objectif de cette recherche était d’évaluer les contraintes liées à l’utilisation d’ensembles de données historiques lors de la modélisation de la distribution spatiale des helminthes parasites chez les ruminants. Un ensemble de données parasitologiques fourni par CREMOPAR (Naples, Italie) et couvrant la majeure partie de l’Italie a été utilisé dans cet article. Un modèle de base (Random Forest, VECMAP®) utilisant l’ensemble des données a d’abord été utilisé pour déterminer le nombre minimal de points de données nécessaires pour construire un modèle stable. Ensuite, des modèles de distribution annuelle ont été calculés et comparés au modèle de référence. Le meilleur taux de prédiction et le meilleur résultat statistique ont été obtenus pour 2012 et le plus mauvais pour 2016, malgré le fait que la taille de l’échantillon du premier était nettement plus petite que celle du second. Nous discutons comment cela peut s’expliquer par le fait qu’en 2012, les échantillons étaient plus uniformément répartis géographiquement, alors qu’en 2016, la plupart des données étaient fortement regroupées. On conclut que la distribution spatiale des données d’entrée semble être plus importante que la taille réelle de l’échantillon lors du calcul des modèles de distribution des espèces. C’est souvent un problème majeur pour développer des modèles spatiaux quand on utilise des données historiques. Ces ensembles de données comportent souvent des biais d’échantillonnage et de grandes lacunes géographiques. Si ce biais n’est pas corrigé, les résultats du modèle de distribution spatiale peuvent représenter l’effort d’échantillonnage plutôt que la distribution réelle des espèces.
Key words: Dicrocoelium dendriticum / Ruminants / Italy / Distribution / Prevalence / Spatial modeling
Note to the reader: The name of the author Smaragda Sotiraki has been corrected on 1st July 2021, because it was misspelled in the previous version. A modification has also been made in institute 4.
© A. Hendrickx et al., published by EDP Sciences, 2021
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (https://creativecommons.org/licenses/by/4.0), which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.
Current usage metrics show cumulative count of Article Views (full-text article views including HTML views, PDF and ePub downloads, according to the available data) and Abstracts Views on Vision4Press platform.
Data correspond to usage on the plateform after 2015. The current usage metrics is available 48-96 hours after online publication and is updated daily on week days.
Initial download of the metrics may take a while.