DOCDB – "Faire entrer un carré dans un cercle"
Partie I – Aperçu des codes de type et des suffixes de numéro exotiques
Pour déterminer l'état de la technique dans un domaine, nos utilisateurs ont besoin d'accéder rapidement et aisément à autant d'informations brevets que possible, dès que celles-ci sont disponibles. La collection DOCDB de l'OEB est l'une des plus grandes bases de données bibliographiques du monde. Elle contient des informations concernant des demandes de brevet et des brevets délivrés, des modèles d'utilité et des dessins ou modèles industriels, ainsi que d'autres types de droits de propriété industrielle. Avec près de 140 millions de documents provenant de plus de 90 pays du monde et remontant jusqu'au début du 19e siècle, la couverture de DOCDB continue de croître.
Le plus grand défi à relever pour les experts de l'OEB en matière de données est de gérer tous les différents types de documents et formats de données – qu'il s'agisse d'anciens documents de l'OEB ou de documents transmis par des offices de PI – en particulier lorsqu'ils sont incomplets ou qu'ils ne satisfont pas aux exigences de DOCDB. Il existe de nombreux facteurs à prendre en compte : l'âge du document, les documents que les offices sont capables et ont le droit de fournir, les codes et les formats propres aux offices, les différents systèmes de PI et les fréquentes révisions des législations nationales en matière de brevets.
Pour intégrer autant de données que possible et combler les lacunes dans les données bibliographiques, nos experts ont dû trouver un moyen de "faire entrer un carré dans un cercle". S'inspirant des codes INID , ils ont eu l'idée d'appliquer le même principe aux "non-publications" (telles que les données enregistrées concernant une demande ou une priorité). Étant donné que ces documents n'ont pas été créés avec des codes de type de document, ils n'étaient pas accessibles au public dans les données bibliographiques. L'attribution de codes et de suffixes fictifs internes à ces documents a permis de les rendre immédiatement téléchargeables et de combler des lacunes en matière de données, de manière temporaire et parfois permanente.
Cette solution fonctionne bien pour la plupart des données enregistrées, mais certaines données nécessitent encore une intervention manuelle. Nos experts doivent alors inspecter attentivement les données pour déterminer ce qui peut être utilisé et ce qui doit être supprimé ou pour décider si les données doivent être fournies de nouveau.
Les codes et suffixes fictifs internes, ou codes de type "exotiques", sont rares, mais il est possible que vous les rencontriez dans votre travail quotidien (et que vous les preniez à tort pour des erreurs dans les données). L'aperçu ci-dessous vous aidera à les reconnaître. Vous pouvez également les consulter dans la liste de concordance des codes de type .
Vous trouverez des descriptions détaillées de ces codes de type dans la partie II de cet article dans l'une des prochaines éditions de Patent Knowledge News.
Codes de type fictifs internes (aperçu)
- D et Q sont utilisés pour les demandes incomplètes ou les demandes dont le format n'est pas conforme.
- K, L, M, N et O sont utilisés pour les demandes de certains systèmes juridiques.
- E, F et M sont utilisés pour les demandes françaises déposées entre 1900 et les années 1960.
Figure 1 : exemple de code de type "D" appliqué à un numéro de demande.
Suffixes de numéro de priorité et de demande (aperçu)
- D (demande provisoire) et T (priorité) sont utilisés de manière provisoire jusqu'à la réception du jeu de données complet.
- T est utilisé pour créer des priorités fictives pour des publications très anciennes afin de les regrouper dans des familles techniques.
- X est utilisé pour les priorités revendiquées dans des publications du début du 20e siècle.
Figure 2 : exemple de suffixe "T" appliqué à un numéro de priorité.
Dans la seconde partie de cet article, nous nous pencherons de plus près sur ces codes et suffixes de numéro exotiques, notamment sur leur utilisation et leur origine.
Abonnez-vous à la lettre d'information de l'OEB pour ne pas rater cet article, ni aucun autre article.
Mots-clés : DOCDB, codes de type de document, suffixes de numéro