Numéro |
OCL
Volume 32, 2025
Diversity of Plant Proteins extracted from Oil & Protein Crop / Diversité des protéines végétales issues des oléoprotéagineux
|
|
---|---|---|
Numéro d'article | 16 | |
Nombre de pages | 13 | |
DOI | https://doi.org/10.1051/ocl/2025008 | |
Publié en ligne | 4 juin 2025 |
Research Article
Analysis of the factors that influence the quality of rapeseed and sunflower seeds and development of predictive models☆
Analyse des facteurs impactant la qualité des graines du colza et tournesol, et développement de modèles prédictifs
1
Terres Inovia, 78850 Thiverval-Grignon, France
2
Université de Toulouse, INRAE, UMR AGIR, 31326 Castanet-Tolosan, France
* Corresponding author: philippe.debaeke@inrae.fr
Received:
22
October
2024
Accepted:
14
March
2025
This study examined the factors influencing the quality of rapeseed (Brassica napus L.) and sunflower (Helianthus annuus L.) seeds, to find out the factors having the greatest impact on protein and oil concentration. Historical data from variety and N fertilization trials were used for these analyses, and to subsequently develop predictive models of seed quality.
The results showed that several environmental, agronomic and genetic factors significantly affect seed quality of oilseeds. These factors include region, soil texture, weather conditions (global radiation, precipitation, temperature), variety characteristics (maturity and flowering earliness, flowering duration, plant height, oil and protein potential concentrations), and crop practices (sowing date and density, N-fertilization).
The best-performing model for predicting protein and oil concentration in rapeseed and sunflower seeds was the Random Forest model. The model achieved good predictive accuracy, with over 84% of well-predicted values falling within acceptable ranges for rapeseed seed quality (oil and protein concentrations), and the same for sunflower protein concentration. However, some progress has to be done for sunflower oil concentration, as less than 59% of the situations were satisfactorily predicted.
Résumé
Cette étude a examiné les facteurs influençant la qualité des graines de colza et de tournesol, pour déterminer ceux qui impactent le plus les teneurs en protéines et en huile. Des données historiques provenant d'essais variétaux et de fertilisation azotée ont été utilisées pour ces analyses, et pour développer des modèles prédictifs de la qualité des graines.
Les résultats ont montré que plusieurs facteurs affectent de manière significative la qualité des graines. Ces facteurs comprennent la région, la texture du sol, les conditions climatiques (rayonnement, précipitations, température), les caractéristiques variétales (précocité à maturité et à floraison, durée de floraison, hauteur de la plante, teneurs potentielles en huile et en protéines des graines), et les pratiques culturales (date et densité de semis, fertilisation azotée). Le modèle le plus performant pour prédire la concentration en protéines et en huile des graines de colza et de tournesol était le modèle « Random Forest ». Ce modèle a permis de prédire plus de 84% des valeurs de qualité des graines de colza (teneurs en huile et en protéines), et de teneur en protéines des graines de tournesol. Cependant pour la teneur en huile du tournesol, moins de 59% des valeurs ont été correctement prédites.
Key words: Rapeseed (Brassica napus L.) / sunflower (Helianthus annuus L.) / seed protein concentration / seed oil concentration / random forest / seed quality
Mots clés : Colza (Brassica napus L.) / tournesol (Helianthus annuus L.) / teneur en protéines / teneur en huile / random forest / qualité des graines
© A. El Msayryb et al., Published by EDP Sciences, 2025
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (https://creativecommons.org/licenses/by/4.0), which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.
Les statistiques affichées correspondent au cumul d'une part des vues des résumés de l'article et d'autre part des vues et téléchargements de l'article plein-texte (PDF, Full-HTML, ePub... selon les formats disponibles) sur la platefome Vision4Press.
Les statistiques sont disponibles avec un délai de 48 à 96 heures et sont mises à jour quotidiennement en semaine.
Le chargement des statistiques peut être long.