DOCDB - "Faire entrer un carré dans un cercle"
Partie II – Codes de type et suffixes de numéro exotiques : détails
Dans le monde de la PI, l'information brevets conduit à la connaissance des brevets et est à l'origine de tout ce que nous savons sur l'état de la technique.
Les pays qui échangent des données avec l'OEB sont très intéressés de voir leurs données chargées dans DOCDB et présentées correctement. Il est essentiel aussi que les examinateurs de brevets de l'OEB aient toutes ces informations à leur disposition pour effectuer les recherches et les examens aux niveaux élevés qui font la réputation de l'Office. Nos experts en matière de données en sont, bien entendu, parfaitement conscients et travaillent sans relâche à combler les vides et à actualiser les informations disponibles.
Cette deuxième partie sur les codes de type exotiques décrit plus en détails les codes et les suffixes que vous pouvez rencontrer dans les numéros de demande ou numéros de priorité, et vous donne aussi quelques indications du contexte historique.
Codes de type D et Q
Il s'agit de codes internes utilisés pour identifier les demandes présentant des données bibliographiques incomplètes, ceci pour différentes raisons : dossiers ne répondant pas aux normes de publication de l'OMPI, collections fournies sous un format différent ou absence d'informations telles que les dates ou les codes de type. Par exemple, les bases de données de l'OEB contiennent des publications très anciennes, disponibles uniquement au format PDF ou sous forme d'images mais sans données bibliographiques. Par le passé et pour les besoins internes de l'OEB, ces publications ont été enregistrées uniquement avec leur numéro de publication. Pour contourner la difficulté, le numéro de la demande se composait du numéro de publication et du code de type D. Dans certains cas, le numéro de la demande était utilisé aussi à la place d'une date manquante (ne pas considérer cela comme erreur dans les données bibliographiques - voir l'écran reproduit ci-dessous).
Figure 1.
Exemple d'un numéro de demande avec une date dérivée du numéro de publication (cliquez sur l'image pour l'agrandir)
Note: D et Q sont utilisés uniquement en interne pour identifier les mesures correctrices nécessaires :
- Les problèmes correspondant au code de type D ne peuvent être résolus que lors d'un exercice de correction automatique du fonds brevets.
- Les problèmes correspondant au code de type Q nécessitent une action intellectuelle et sont résolus manuellement l'un après l'autre.
Codes K, L, M, N et O
Certains pays, par exemple : MC, PH, RU et SU, utilisent les mêmes numéros de demande pour différentes publications. Pour que ces numéros soient uniques, un code est ajouté à chaque numéro de demande, dans l'ordre alphabétique en commençant par K.
Figure 2. Numéro de demande MC1374 avec le code interne K
Figure 3. Numéro de demande MC1374 avec le code interne L
Anciennes demandes françaises avec les codes de type E, F et M
Ces codes s'appliquent aux demandes françaises déposées entre 1900 et les années 1960, chargées avec des codes de type incorrects et sans date au format XML. Certaines de ces demandes avaient les mêmes numéros que d'autres publications si bien qu'il était impossible de les distinguer. Pour que ces publications n'existant qu'au format PDF soient visibles dans des outils comme Espacenet, nous avons été obligés de créer tout d'abord un dossier bibliographique. Pour ce faire, nous avons extrait uniquement le numéro de publication du document et nous lui avons ajouté l'un des codes de type précités. Avec ce nouveau dossier bibliographique, même s'il ne comporte qu'un seul numéro, les utilisateurs peuvent accéder au document dans Espacenet.
Figure 4. Numéro de publication FR99 avec le suffixe E
Figure 5. Numéro de Publication FR99 avec le suffixe F
Numéros portant le suffixe D ou T
Les numéros de demande portant le suffixe D et les numéros de priorité portant le suffixe T sont des entrées "fictives". Elles seront remplacées par la suite par les véritables identifiants dès que l'OEB disposera des données bibliographiques, ceci uniquement si le pays en question fournit un nouveau fonds brevets. Le chargement des données déclenche par la suite une renumérotation où les entrées fictives sont remplacées par les véritables identifiants. C'est pourquoi le nombre d'enregistrements avec des suffixes fictifs dans les bases de données diminue au fil des années.
Numéros portant le suffixe T
Les publications très anciennes, fournies sur papier, ont été enregistrées avec seulement les numéros de publication. Lorsque cela a été possible, les examinateurs de l'OEB ont regroupé les publications dans des familles de brevets après avoir étudié leur contenu technique et créé une priorité fictive à partir de l'un des numéros de publication de la famille et en ajoutant le suffixe T.
Figure 6.
Exemple tiré de Global Patent Index : suffixe T ajouté au numéro de priorité
Numéros portant le suffixe X
Il s'agit de priorités qui sont revendiquées dans des publications remontant au début du XXe siècle et qui se trouvent souvent dans des documents venant des États-Unis. À l'époque, les revendications de priorité ne comportaient pas de numéro et étaient identifiables uniquement avec le pays et la date. Or DOCDB requiert un numéro de priorité pour chaque enregistrement afin de créer une famille de brevets. L'OEB a donc généré un numéro de priorité composé du numéro de publication et du suffixe X.
Pour utiliser DOCDB au format XML, il est important de se souvenir que les numéros portant les suffixes D, T ou X se présentent comme suit :
- code de pays,
- D ou T ou X :
- numéro,
- code de type lorsque le code de type n'est pas "A".
Comme vous le voyez, les experts de l'OEB s'appliquent à vous donner accès à un maximum d'information brevets dès que possible. Si vous avez besoin d'aide sur les codes de type ou tout autre aspect lié aux données, contactez notre équipe d'experts à l'adresse suivante : patentdata@epo.org.
Pour en savoir plus :
Mots-clés : DOCDB, codes de type de document, suffixes de numéro