evalhyd.vigicrues.read_prd_from_xml_sandre

read_prd_from_xml_sandre(xml_files, seek_issue_date=True)

Lire les fichiers au format XML-SANDRE contenant les prédictions de débits et retourner sous forme de pandas.DataFrame.

Paramètres:
xml_files: list

La liste de fichiers au format XML-SANDRE contenant les prédictions de débits.

seek_issue_date: bool, optional

Choix de rechercher ou non les dates d’émission dans les fichiers pour en déduire les échéances de prévision. Si le choix est fait de ne pas les rechercher, les échéances de prévision seront des rangs au lieu d’être des durées. Ceci implique que les échéances entre les entités sont supposées être les mêmes puisque, après l’assignation des rangs en lieu et place des durées, elles seront identifiées par les mêmes intitulés. Par défaut, les dates d’émission sont recherchées et une erreur est générée si elles sont absentes.

Retourne:
pandas.DataFrame

La structure de données contenant les prédictions de débits.

Exemples

Récupérer les prédictions de débits sous forme de dataframe :

>>> df = read_prd_from_xml_sandre(['data/GRP_B_20241211_1023_5304.xml'])
>>> df.xs('K0045510', level='entite', drop_level=False).xs('0001', level='membre', drop_level=False)
                                                     valeur
entite   echeance        membre date_validite
K0045510 0 days 01:00:00 0001   2024-12-11 11:00:00   558.0
         0 days 02:00:00 0001   2024-12-11 12:00:00   553.0
         0 days 03:00:00 0001   2024-12-11 13:00:00   547.0
         0 days 04:00:00 0001   2024-12-11 14:00:00   541.0
         0 days 05:00:00 0001   2024-12-11 15:00:00   535.0
...                                                     ...
         4 days 20:00:00 0001   2024-12-16 06:00:00   922.0
         4 days 21:00:00 0001   2024-12-16 07:00:00   904.0
         4 days 22:00:00 0001   2024-12-16 08:00:00   886.0
         4 days 23:00:00 0001   2024-12-16 09:00:00   869.0
         5 days 00:00:00 0001   2024-12-16 10:00:00   852.0

[120 rows x 1 columns]