﻿WEBVTT

00:00:08.800 --> 00:00:11.760
Bonjour tout le monde,

00:00:11.779 --> 00:00:15.090
je vais entrer directement dans le sujet.

00:00:15.091 --> 00:00:17.920
Qu'est ce que toutes ces images ont en commun?

00:00:18.400 --> 00:00:22.320
Nous pouvons voir que ce sont des images,

00:00:22.321 --> 00:00:23.599
des documents,

00:00:23.600 --> 00:00:27.960
mais ce n'est pas évident de voir ce qu'elles ont d'autre

00:00:27.961 --> 00:00:31.840
en commun. Si je m'arrête sur cette image,

00:00:31.841 --> 00:00:33.520
c'est une capture d'écran

00:00:33.521 --> 00:00:35.680
venant d'une plate-forme d'objets numériques

00:00:35.681 --> 00:00:38.879
appelée "Digitised manuscripts", nous pouvons voir que l'image

00:00:38.880 --> 00:00:40.760
affichée a une catégorie d'image f-i-r

00:00:40.761 --> 00:00:44.080
ce qui ne signifie peut être pas grand-chose

00:00:44.081 --> 00:00:46.040
pour la plupart des gens

00:00:46.041 --> 00:00:48.360
mais pour les gens au courant

00:00:48.361 --> 00:00:51.480
cette légende désigne le recto d'une feuille volante

00:00:51.481 --> 00:00:54.240
et nous pouvons voir qu'il s'agit d'une image

00:00:54.241 --> 00:00:56.880
qui n'est pas une feuille volante mais

00:00:56.881 --> 00:00:59.120
c'est le manteau d'une Torah

00:00:59.121 --> 00:01:01.280
Donc ce que toutes ces images

00:01:01.281 --> 00:01:03.160
ont en commun

00:01:03.161 --> 00:01:06.900
c'est que sur le site internet Digitised manuscript,

00:01:06.901 --> 00:01:08.759
elles sont toutes classées

00:01:08.760 --> 00:01:12.719
comme des feuilles volantes

00:01:12.720 --> 00:01:16.520
mais ce ne sont pas des feuilles volantes donc nous

00:01:16.521 --> 00:01:20.000
les appelons fausses feuilles volantes.

00:01:20.001 --> 00:01:22.799
Digitised manuscripts est une plate-forme

00:01:22.800 --> 00:01:25.200
qui a été conçue pour un projet particulier,

00:01:25.201 --> 00:01:28.000
elle avait un ensemble limité de catégories d'images qui

00:01:28.001 --> 00:01:30.880
répondait aux exigences de ce projet.

00:01:30.881 --> 00:01:32.880
Quand la plate-forme a été mise en ligne

00:01:32.881 --> 00:01:34.800
les conservateurs de la British library

00:01:34.802 --> 00:01:37.422
étaient très enthousiastes à propos de cette plate-forme

00:01:37.424 --> 00:01:39.143
et ils voulaient publier leurs manuscrits

00:01:39.145 --> 00:01:40.799
et leurs ressources sur cette plate-forme

00:01:40.800 --> 00:01:42.019
même si

00:01:42.040 --> 00:01:44.128
ces documents et images n'entraient pas

00:01:44.152 --> 00:01:46.239
dans les catégories conçues pour cette plate-forme

00:01:46.240 --> 00:01:47.440
n'ont pas rencontré

00:01:47.441 --> 00:01:50.020
les exigeances de légende de la plateforme.

00:01:50.021 --> 00:01:52.280
Donc sur cette plateforme il y a

00:01:52.282 --> 00:01:55.002
beaucoup d'images décrites comme des feuilles volantes

00:01:55.041 --> 00:01:56.940
mais ce ne sont en réalité ni des images

00:01:57.041 --> 00:01:58.440
ni des feuilles volantes.

00:01:58.441 --> 00:02:00.960
La catégorie d'image que vous voyez sur la plate-forme

00:02:00.961 --> 00:02:03.520
est liée au nom du fichier de l'image.

00:02:04.601 --> 00:02:08.160
Nous avons un nouveau visualiseur à la bibliothèque

00:02:08.161 --> 00:02:10.879
c'est la solution "Universal Viewer".

00:02:10.880 --> 00:02:14.400
Ce visualiseur est doté d'une fonctionnalité de catégorisation d'images

00:02:14.401 --> 00:02:15.720
plus souple et étendue

00:02:15.721 --> 00:02:18.360
ce qui signifie que lorsque nous ferons migrer le contenu

00:02:18.361 --> 00:02:20.640
de l'ancienne plate-forme "Digitized manuscripts"

00:02:20.641 --> 00:02:22.720
vers la nouvelle plate-forme

00:02:22.721 --> 00:02:24.959
nous aurons l'opportunité

00:02:24.960 --> 00:02:26.959
de reclasser les images

00:02:26.960 --> 00:02:30.879
qui ne sont pas à leur place dans la catégorie "feuilles volantes"

00:02:30.880 --> 00:02:33.120
dans une catégorie plus appropriée.

00:02:33.121 --> 00:02:34.879
Ici nous avons une capture d'écran

00:02:34.880 --> 00:02:37.280
de notre "Universal viewer"

00:02:37.281 --> 00:02:39.599
et les images que vous voyez maintenant

00:02:39.600 --> 00:02:42.600
auraient typiquement été considérées comme des "feuilles volantes"

00:02:42.602 --> 00:02:44.802
dans notre ancienne plate-forme

00:02:44.900 --> 00:02:46.320
"Digitised manuscripts".

00:02:46.321 --> 00:02:49.600
Ici nous avons la tranche d'un livre

00:02:49.601 --> 00:02:53.320
et nous pouvons la catégoriser comme telle,

00:02:53.321 --> 00:02:56.600
nous avons une feuille volante qui a une deuxième foliotation

00:02:56.601 --> 00:02:59.160
en chiffres romains que nous pouvons classer

00:02:59.161 --> 00:03:01.779
dans une catégorie plus appropriée, et nous avons

00:03:01.980 --> 00:03:03.840
le cas d'une image dépliée

00:03:03.879 --> 00:03:06.239
encore une fois nous pouvons lui attribuer

00:03:06.240 --> 00:03:08.360
une catégorie plus appropriée,

00:03:08.361 --> 00:03:11.360
et nous avons une vue de trois quarts de ce document

00:03:11.361 --> 00:03:14.239
et nous pouvons lui attribuer une catégorie

00:03:14.240 --> 00:03:16.080
plus appropriée.

00:03:16.081 --> 00:03:19.240
Ainsi, non seulement nous allons faire migrer

00:03:19.241 --> 00:03:22.880
le contenu de notre ancienne plate-forme

00:03:22.881 --> 00:03:27.920
vers le nouveau visualiseur, mais nous traitons aussi les fruits

00:03:27.921 --> 00:03:31.200
de 20 ans de numérisation

00:03:31.201 --> 00:03:34.159
que nous intégrons à des fins de préservation

00:03:34.160 --> 00:03:37.040
dans l'espace de stockage de notre bibliothèque en numérique

00:03:37.041 --> 00:03:39.460
et en faisant en sorte que ces contenus soient disponibles

00:03:39.461 --> 00:03:41.619
via le visualiseur "Universal viewer".

00:03:41.720 --> 00:03:44.080
Nous avons une montagne de contenus

00:03:44.081 --> 00:03:46.720
et dans cette montagne de contenus nous savons

00:03:46.721 --> 00:03:49.440
que nous avons beaucoup d'images qui ont été catégorisées

00:03:49.441 --> 00:03:51.920
comme des feuilles volantes mais qui ne sont pas des images

00:03:51.921 --> 00:03:53.240
de feuilles volantes.

00:03:53.241 --> 00:03:55.800
Comment donc pouvons-nous les identifier facilement

00:03:55.801 --> 00:03:58.640
pour nous donner l'opportunité de leur attribuer

00:03:58.641 --> 00:04:01.360
une catégorie correcte

00:04:01.361 --> 00:04:04.400
sur notre nouvelle plate-forme qu'est Universal viewer?

00:04:07.519 --> 00:04:10.639
C'est là qu'intervient la vision par ordinateur

00:04:10.640 --> 00:04:13.759
comme une potentielle approche

00:04:13.760 --> 00:04:15.598
pour résoudre ce problème

00:04:15.599 --> 00:04:18.999
et plus précisément nous voulions créer

00:04:19.000 --> 00:04:21.359
un processus pour créer un modèle de vision

00:04:21.360 --> 00:04:23.880
par ordinateur qu'on pourrait mettre à jour

00:04:23.881 --> 00:04:26.400
avec de nouvelles données d'entraînement.

00:04:26.401 --> 00:04:27.960
L'autre élément clé

00:04:27.961 --> 00:04:29.400
de ce modèle

00:04:29.401 --> 00:04:33.120
et de ce processus est que nous voulions

00:04:33.121 --> 00:04:35.759
que tout soit assez ennuyeux car le but

00:04:35.760 --> 00:04:38.560
de cette étape particulière était de s'intégrer

00:04:38.561 --> 00:04:40.400
à un processus existant et d'appliquer

00:04:40.401 --> 00:04:43.360
les techniques de vision par ordinateur et d'apprentissage automatique

00:04:43.361 --> 00:04:46.720
de manière très pragmatique.

00:04:46.721 --> 00:04:50.639
Dans ce cadre nous avons utilisé des outils

00:04:50.640 --> 00:04:53.240
tels que le DVC (data version control)

00:04:53.241 --> 00:04:55.960
pour créer une chaine de traitement reproductible

00:04:55.961 --> 00:04:57.760
qui quand on lui donne de nouvelles données

00:04:57.760 --> 00:04:59.659
pourrait les recycler et produire

00:04:59.660 --> 00:05:01.060
un nouveau modèle

00:05:01.061 --> 00:05:03.660
que nous pourrions alors appliquer

00:05:03.661 --> 00:05:07.120
aux feuilles volantes que nous voulons détecter.

00:05:07.180 --> 00:05:09.020
(diapositive suivante s'il vous plaît)

00:05:09.039 --> 00:05:11.519
Une fois que nous avons ce modèle

00:05:11.520 --> 00:05:15.280
entraîné de vision par ordinateur qui est capable

00:05:15.281 --> 00:05:18.400
de détecter si une image affichée

00:05:18.401 --> 00:05:21.640
est une fausse feuille volante ou non, nous le déployons

00:05:21.641 --> 00:05:24.960
dans une application de ligne de commande

00:05:24.961 --> 00:05:27.199
et c'est ce qui a été choisi

00:05:27.200 --> 00:05:29.520
comme type d'approche pour déployer

00:05:29.521 --> 00:05:31.680
ce modèle spécifique de vision par ordinateur:

00:05:31.681 --> 00:05:34.039
parce qu'il s'intègre bien dans les processus existants

00:05:34.080 --> 00:05:36.238
et qu'il trouve sa place parmi les outils

00:05:36.239 --> 00:05:38.240
que les personnes qui vont l'utiliser

00:05:38.241 --> 00:05:39.760
connaissent déjà.

00:05:39.761 --> 00:05:42.440
Donc voici ce que fait cet outil de ligne de commande:

00:05:42.441 --> 00:05:45.440
à partir d'un ensemble organisé d'images à regarder,

00:05:45.441 --> 00:05:47.480
il explore récursivement

00:05:47.481 --> 00:05:50.560
les différentes parties et sous-parties

00:05:50.561 --> 00:05:53.440
de cet ensemble et recherche des images

00:05:53.441 --> 00:05:55.840
qui comportent "feuille volante" dans le nom du fichier

00:05:55.841 --> 00:05:56.880
et ensuite il prédit

00:05:56.881 --> 00:05:59.120
si cette feuille volante en est réellement

00:05:59.121 --> 00:06:00.800
une ou non.

00:06:00.801 --> 00:06:05.440
Cette prédiction est éditée sous forme d'un rapport CSV

00:06:05.441 --> 00:06:07.600
qui est ensuite utilisé par la personne

00:06:07.601 --> 00:06:09.759
qui exécute cet outil. (diapositive suivante)

00:06:10.000 --> 00:06:13.440
Ceci est une rapide capture d'écran

00:06:13.441 --> 00:06:15.600
de l'application Flyswot

00:06:15.601 --> 00:06:17.440
et bien que nous utilisons l'interface

00:06:17.441 --> 00:06:20.000
de ligne de commande nous essayons toujours

00:06:20.001 --> 00:06:22.000
de donner à l'utilisateur de l'outil

00:06:22.000 --> 00:06:23.960
beaucoup d'informations sur le modèle

00:06:24.061 --> 00:06:26.099
et c'est quelque chose que nous voulons continuer

00:06:26.120 --> 00:06:28.160
de construire de telle sorte que le type

00:06:28.161 --> 00:06:30.140
de vision par ordinateur

00:06:30.141 --> 00:06:32.080
sur lequel repose l'outil Flyswot

00:06:32.081 --> 00:06:34.020
ne soit pas caché à l'utilisateur.

00:06:34.021 --> 00:06:35.940
Je passe la parole à Andrew.

00:06:36.000 --> 00:06:39.919
Merci Daniel. Je vais juste expliquer un peu plus

00:06:39.920 --> 00:06:42.080
comment nous avons inscrit

00:06:42.081 --> 00:06:44.560
ce logiciel dans notre processus général,

00:06:44.561 --> 00:06:46.400
donc au début

00:06:46.401 --> 00:06:48.639
quand nous avons conçu cet outil nous avons pensé

00:06:48.640 --> 00:06:50.639
que ce pourrait être un outil magique

00:06:50.640 --> 00:06:52.240
qui classerait toutes les images

00:06:52.241 --> 00:06:53.719
que nous avons

00:06:53.720 --> 00:06:55.440
et nous ferait gagner beaucoup de temps

00:06:55.441 --> 00:06:57.319
à inspecter visuellement les images,

00:06:57.340 --> 00:06:59.820
mais nous nous sommes vite rendu compte que,

00:06:59.821 --> 00:07:01.260
parce que

00:07:01.261 --> 00:07:03.160
malheureusement nous avons

00:07:03.161 --> 00:07:05.219
une collection très vaste et très variée,

00:07:05.220 --> 00:07:07.279
avec beaucoup de distinctions subtiles

00:07:07.280 --> 00:07:09.339
d'un ensemble à un autre,

00:07:09.342 --> 00:07:11.603
que donc cette classification automatique

00:07:11.641 --> 00:07:13.360
ne serait pas possible et,

00:07:14.401 --> 00:07:15.800
ça va même plus loin,

00:07:15.801 --> 00:07:17.240
que la classification d'un ensemble

00:07:17.400 --> 00:07:20.240
peut être vraiment très différente de celle d'un autre ensemble

00:07:20.340 --> 00:07:22.460
qui recouvre des documents pourtant très semblables

00:07:23.301 --> 00:07:25.500
donc que l'intervention ou la vérification manuelles

00:07:25.600 --> 00:07:27.080
allaient toujours être nécessaires

00:07:27.781 --> 00:07:29.259
sous une forme ou une autre.

00:07:29.260 --> 00:07:31.260
Mais ce que nous voulions principalement

00:07:31.261 --> 00:07:33.440
comme l'a mentionné Daniel était un outil

00:07:33.441 --> 00:07:35.919
qui nous donnerait la différence

00:07:35.920 --> 00:07:37.919
entre une réelle feuille volante et autre chose

00:07:37.920 --> 00:07:40.160
donc un outil qui nous indiquerait juste

00:07:40.161 --> 00:07:41.960
la bonne direction, nous disant

00:07:41.961 --> 00:07:44.720
où nous devrions faire une intervention manuelle.

00:07:44.721 --> 00:07:46.879
Ensuite, d'un point de vue pratique

00:07:46.880 --> 00:07:48.960
d'intégration dans le processus

00:07:48.961 --> 00:07:51.120
nous nous sommes dit que cela ferait sens

00:07:51.121 --> 00:07:53.159
d'intégrer cet outil à d'autres logiciels

00:07:53.160 --> 00:07:55.080
que nous utilisions déjà

00:07:55.082 --> 00:07:57.401
donc nous avons élaboré des rapports Power BI

00:07:57.402 --> 00:07:59.441
pour regarder directement

00:07:59.441 --> 00:08:01.440
les résultats en CSV

00:08:01.441 --> 00:08:03.440
ce qui permet de les comprendre et

00:08:03.440 --> 00:08:05.140
de les utiliser plus facilement.

00:08:05.441 --> 00:08:07.280
Donc l'un des principaux résultats

00:08:07.281 --> 00:08:09.479
que nous avons obtenus très vite était le nombre total

00:08:09.480 --> 00:08:12.479
d'éléments que nous aurions besoin d'examiner de plus près

00:08:12.480 --> 00:08:13.720
dans un lot d'images.

00:08:13.721 --> 00:08:16.000
Donc combien de documents dans ce lot

00:08:16.001 --> 00:08:17.599
de centaines

00:08:17.600 --> 00:08:18.920
de documents

00:08:18.921 --> 00:08:21.240
comportent de fausses feuilles volantes manifestes

00:08:21.241 --> 00:08:23.039
ou des images où le modèle n'est pas sûr

00:08:23.040 --> 00:08:24.720
de reconnaître une feuille volante ?

00:08:24.721 --> 00:08:27.360
Donc nous aurons besoin ici d'une double vérification.

00:08:27.400 --> 00:08:29.279
Ceci est très utile car cela nous aide

00:08:31.380 --> 00:08:33.279
à comprendre l'ampleur du travail nécessaire

00:08:33.280 --> 00:08:35.839
pour changer les catégories dans ce lot d'images

00:08:35.840 --> 00:08:38.080
et ensuite nous pouvons décider

00:08:38.081 --> 00:08:40.400
comment répartir nos moyens et

00:08:40.480 --> 00:08:43.659
prioriser notre travail.

00:08:44.060 --> 00:08:46.700
(diapositive suivante s'il vous plaît/s'il te plaît, Catherine)

00:08:46.800 --> 00:08:48.879
Voici un exemple

00:08:48.880 --> 00:08:52.959
de certains des visuels du rapport Power BI.

00:08:52.960 --> 00:08:55.040
et un autre avantage qu'il y a

00:08:55.041 --> 00:08:56.820
à intégrer Power BI aux outils

00:08:56.821 --> 00:08:58.419
que nous utilisons, c'est que

00:08:58.420 --> 00:09:00.380
ça permet de nous concentrer immédiatement

00:09:00.419 --> 00:09:03.960
et spécifiquement sur les documents avec des fausses feuilles volantes,

00:09:03.961 --> 00:09:05.320
donc plutôt que de parcourir

00:09:05.321 --> 00:09:08.399
une longue liste CSV d'adresses de fichiers et d'essayer

00:09:08.400 --> 00:09:10.400
de les distinguer, Power BI

00:09:10.499 --> 00:09:12.600
nous montre instantanément une liste,

00:09:12.601 --> 00:09:14.560
juste les documents

00:09:14.561 --> 00:09:17.279
et leurs spécificités qui nécessitent

00:09:17.280 --> 00:09:20.080
une reclassification ou une enquête.

00:09:20.081 --> 00:09:21.282
(diapositive suivante)

00:09:21.360 --> 00:09:24.040
Et puis, un bonus supplémentaire à propos

00:09:24.041 --> 00:09:26.719
de l'intégration de Power BI, c'est qu'il a rapidement

00:09:26.720 --> 00:09:28.340
mis en lumière des résultats inattendus

00:09:28.419 --> 00:09:31.780
et pas immédiatement des prédictions évidentes et des prédictions contradictoires.

00:09:31.781 --> 00:09:32.960
Par exemple

00:09:32.961 --> 00:09:34.280
vous pouvez voir ici

00:09:34.281 --> 00:09:35.960
des cas où la première prédiction,

00:09:35.961 --> 00:09:37.920
peut-être que nous ne l'avons pas dit mais

00:09:37.921 --> 00:09:40.200
il y a deux prédictions qui sont faites dans le modèle,

00:09:40.201 --> 00:09:42.800
la première prédiction dit que c'est

00:09:42.801 --> 00:09:43.960
une feuille volante

00:09:43.961 --> 00:09:46.160
et puis la seconde prédiction dit

00:09:46.161 --> 00:09:47.820
que ce n'est pas une feuille volante

00:09:47.821 --> 00:09:49.560
et donc évidemment c'est quelque chose

00:09:49.562 --> 00:09:51.302
que nous cherchons à comprendre un peu plus

00:09:51.481 --> 00:09:53.120
et nous avons cherché à comprendre plus

00:09:53.221 --> 00:09:55.000
et cela nous a aidés à affiner le modèle

00:09:55.001 --> 00:09:57.280
et son seuil. En utilisant ces outils

00:09:57.281 --> 00:09:59.440
nous avons donc déjà en quelque sorte

00:09:59.441 --> 00:10:01.120
des retours sur le mécanisme

00:10:01.121 --> 00:10:04.339
et cela nous  a aidés à en améliorer la précision.

00:10:04.400 --> 00:10:06.039
(Diapositive suivante s'il vous plaît.)

00:10:06.079 --> 00:10:08.719
En conclusion,

00:10:08.720 --> 00:10:10.840
nous voulions simplement souligner

00:10:10.841 --> 00:10:12.760
comment ce logiciel d'apprentissage automatique

00:10:12.761 --> 00:10:15.760
n'est qu'un des nombreux outils que nous utilisons

00:10:15.761 --> 00:10:18.100
dans le cadre d'un processus agile,

00:10:18.101 --> 00:10:19.940
et s'inscrit dans un ensemble.

00:10:20.000 --> 00:10:22.420
Une intervention manuelle est toujours nécessaire

00:10:22.421 --> 00:10:23.680
comme je l'ai dit

00:10:23.681 --> 00:10:25.680
mais elle est en fait souhaitable

00:10:25.681 --> 00:10:26.760
non seulement à cause

00:10:26.761 --> 00:10:29.000
de la nature subjective de nos documents

00:10:29.001 --> 00:10:31.080
comme je l'ai dit mais aussi

00:10:31.081 --> 00:10:33.220
car je pense c'est assez important

00:10:33.221 --> 00:10:37.020
parce que ce processus semi-automatique que nous utilisons

00:10:37.021 --> 00:10:38.980
est excellent pour instaurer et renforcer

00:10:39.020 --> 00:10:42.800
la confiance au sein de la bibliothèque, envers l'apprentissage

00:10:42.801 --> 00:10:44.240
automatique.

00:10:44.241 --> 00:10:46.320
Car ce n'est pas nécessairement quelque chose

00:10:46.321 --> 00:10:48.160
avec quoi les collègues conservateurs

00:10:48.161 --> 00:10:49.200
sont à l'aise,

00:10:49.201 --> 00:10:51.160
l'apprentissage automatique, mais nous espérons

00:10:51.161 --> 00:10:52.959
qu'ils le deviendront davantage à l'avenir.

00:10:52.960 --> 00:10:54.640
C'est un excellent moyen

00:10:54.641 --> 00:10:56.480
de les amener là-dedans,

00:10:56.481 --> 00:10:59.000
dans l'utilisation du processus, et les amener

00:10:59.001 --> 00:11:01.440
à utiliser l'apprentissage automatique.

00:11:01.441 --> 00:11:05.600
(Diapositive suivante s'il te plaît, Catherine)

00:11:05.601 --> 00:11:08.140
C'est tout pour nous

00:11:08.141 --> 00:11:14.820
vraiment merci beaucoup.