https://www.epo.org/de/searching-for-patents/helpful-resources/patent-knowledge-news/docdb-was-nicht-passt-wird-passend-1

DOCDB - Was nicht passt, wird passend gemacht

Teil II: Exotische Dokumentenartencodes und Nummernsuffixe – ausführliche Erläuterungen


In der Welt des geistigen Eigentums führt Patentinformation zu Patentwissen und Wissen über den Stand der Technik.

Länder und Regionen, die Daten mit dem EPA austauschen, haben großes Interesse daran, dass ihre Daten in DOCDB geladen und korrekt dargestellt werden. Die Patentprüfer/innen des EPA brauchen Zugang zu all diesen Informationen, um Recherchen und Prüfungen nach den hohen Standards durchführen zu können, für die das EPA bekannt ist. Unsere Datenexperten sind sich dessen natürlich sehr bewusst und arbeiten ständig daran, Datenlücken zu schließen und die Inhalte auf dem neuesten Stand zu halten.

Dieser zweite Teil über exotische Dokumentenartencodes geht ausführlicher auf die Codes und Suffixe ein, die Sie möglicherweise in Anmelde- oder Prioritätsnummern finden, und gibt ferner einen historischen Überblick.

Die Dokumentenartencodes D und Q

D und Q sind interne Codes, die zur Kennzeichnung von Anmeldungen mit unvollständigen bibliografischen Daten verwendet werden. Sie können aus verschiedenen Gründen zugewiesen werden – für Datensätze, die nicht den WIPO-Veröffentlichungsstandards entsprechen, für Sammlungen, die in einem anderen Format geliefert werden, oder wenn Informationen wie Datumsangaben oder Dokumentenartencodes fehlen. So umfassen die EPA-Datenbanken beispielsweise auch sehr frühe Veröffentlichungen, die nur im PDF- oder Bildformat verfügbar sind und für die keine bibliografischen Daten vorliegen. In der Vergangenheit wurden diese Veröffentlichungen für interne Zwecke und mit der Veröffentlichungsnummer erfasst. Als Anmeldenummer wurde die um den Dokumentenartencode D ergänzte Veröffentlichungsnummer verwendet. In einigen Fällen wurde die so gebildete Anmeldenummer auch anstelle eines fehlenden Datums verwendet (was nicht mit einem Datenfehler zu verwechseln ist – siehe Screenshot unten).


Abbildung 1: Beispiel für aus der Veröffentlichungsnummer gebildete Anmeldenummer und Datumsangabe.  (zum Vergrößern auf das Bild klicken)


Hinweis: D und Q werden intern verwendet, um zu kennzeichnen, wie das vorliegende Problem zu beheben ist:

  • Code-D-Probleme werden durch einen automatisierten Korrekturvorgang anhand einer berichtigten Bestandsdatei behoben.
  • Code-Q-Probleme erfordern ein manuelles Eingreifen und müssen daher einzeln behoben werden.


Die Anmeldungscodes K, L, M, N und O

Einige Länder (z. B. MC, PH, RU, SU) nutz(t)en die gleichen Anmeldenummern für verschiedene Veröffentlichungen. Um diese Nummern eindeutig zu machen, werden die genannten Codes in alphabetischer Reihenfolge beginnend mit K zu den betroffenen Anmeldenummern hinzugefügt.


Abbildung 2: Anmeldenummer MC1374 mit internem Code K.


Abbildung 3: Anmeldenummer MC1374 mit internem Code L.

Ältere französische Anmeldungen mit den Dokumentenartencodes E, F und M

Diese Codes werden französischen Anmeldungen zwischen 1900 und den 1960er-Jahren zugewiesen, die mit falschen Dokumentenartencodes und ohne Datum im XML-Format geladen wurden. Einige haben dieselbe Anmeldenummer wie andere Veröffentlichungen, sodass eine Unterscheidung unmöglich ist. Damit solche Veröffentlichungen, die nur im PDF-Format existieren, in Tools wie Espacenet angezeigt werden können, mussten zunächst Datensätze mit bibliografischen Daten erstellt werden. Zu diesem Zweck haben wir jeweils nur die Veröffentlichungsnummer aus dem Dokument extrahiert und einen der oben genannten Dokumentenartencodes hinzugefügt. Über diesen neu erstellten bibliografischen Datensatz – der somit ggf. nur aus einer einzigen Nummer besteht – kann in Espacenet auf das Dokument zugegriffen werden.


Abbildung 4: Veröffentlichungsnummer FR99 mit Suffix E.


Abbildung 5: Veröffentlichungsnummer FR99 mit Suffix F.


Nummern mit Suffix D oder T

Anmeldenummern mit dem Suffix D und Prioritätsnummern mit dem Suffix T sind "Dummy"-Einträge, die später durch echte Kennungen ersetzt werden, sobald die bibliografischen Daten dem EPA vorliegen. Das kommt vor, wenn die betreffende Behörde eine neue Bestandsdatei bereitstellt. Beim Laden dieser Datei wird eine Umnummerierung ausgelöst, bei der Dummy-Einträge durch echte Kennungen ersetzt werden. So erklärt sich, dass die Anzahl der Datensätze mit Dummy-Suffixen in den EPA-Datenbanken im Laufe der Jahre gesunken ist.

Nummern mit Suffix T

Sehr frühe Veröffentlichungen, die nur auf Papier vorlagen, wurden nur mit der jeweiligen Veröffentlichungsnummer erfasst. Die EPA-Prüfer/innen fassten solche Veröffentlichungen soweit möglich anhand des technischen Inhalts in Patentfamilien zusammen und wiesen eine Dummy-Priorität zu, die aus der Veröffentlichungsnummer eines Familienmitglieds sowie dem Suffix T gebildet wurde.


Abbildung 6: Beispiel aus Global Patent Index für eine Prioritätsnummer mit dem Suffix T.

Nummern mit Suffix X

Dies sind Prioritäten, die in Veröffentlichungen aus dem frühen 20. Jahrhundert beansprucht werden und häufig in US-Dokumenten zu finden sind. Damals wurden Prioritätsansprüche noch nicht mit einer Nummer versehen und konnten nur anhand des Landes und Datums identifiziert werden. Da DOCDB zur Erstellung von Patentfamilien für jeden Datensatz eine Prioritätsnummer benötigt, generierte das EPA diese Nummern aus der Veröffentlichungsnummer und dem Suffix X.

Bei der Nutzung von DOCDB in XML ist zu beachten, dass das folgende spezielle Format für Nummern mit Suffix D, T oder X gilt:

  • Ländercode
  • D oder T oder X
    • Nummer
    • Dokumentenartencode, wenn Dokumentenartencode nicht = 'A'

Wie Sie sehen, bemühen wir uns im EPA sehr, Ihnen alle verfügbaren Patentinformationsdaten möglichst schnell zur Verfügung zu stellen. Wenn Sie Hilfe mit Dokumentenartencodes oder anderen datenbezogenen Themen benötigen, können Sie sich jederzeit per E-Mail unter patentdata@epo.org an unser Expertenteam wenden.


Weitere Informationen


Schlagwörter: DOCDB, Dokumentenartencodes, Nummernsuffixe