6.1. Wiederholbarkeit
6.1.1 Künstliches neuronales Netz
In T 161/18 nutzte die Anmeldung ein künstliches neuronales Netz zur Transformation der an der Peripherie gemessenen Blutdruckkurve in den äquivalenten Aortendruck. Bezüglich des Trainings des erfindungsgemäßen neuronalen Netzes offenbarte die Anmeldung lediglich, dass die Eingabedaten ein breites Spektrum von Patienten unterschiedlichen Alters, Geschlechts, Konstitutionstyps, Gesundheitszustands und dergleichen abdecken sollten, damit es nicht zu einer Spezialisierung des Netzes kommt. Die Anmeldung offenbarte jedoch nicht, welche Eingabedaten zum Trainieren des erfindungsgemäßen künstlichen neuronalen Netzes geeignet sind, oder mindestens einen zur Lösung des vorliegenden technischen Problems geeigneten Datensatz. Das Trainieren des künstlichen neuronalen Netzes konnte daher von der Fachperson nicht nachgearbeitet werden und die Fachperson konnte die Erfindung deshalb nicht ausführen. Die vorliegende, auf maschinellem Lernen insbesondere im Zusammenhang mit einem künstlichen neuronalen Netz beruhende Erfindung war somit nicht ausreichend offenbart, da das erfindungsgemäße Training mangels entsprechender Offenbarung nicht ausführbar war (vgl. T 702/20 über den technischen Charakter eines auf einem Computer implementierten neuronalen Netzes).
In T 1669/21 machte der Beschwerdeführer (Patentinhaber) geltend, die Erfindung sei auch ohne ein konkretes Ausführungsbeispiel im Patent deutlich und vollständig offenbart. Bei dem anspruchsgemäßen Rechenmodell handele es sich um ein Modell des maschinellen Lernens. Angesichts des rasanten Fortschritts sei auch das Erstellen eines geeigneten Rechenmodells des maschinellen Lernens, (anders als in T 161/18) mittlerweile Gegenstand des allgemeinen Fachwissens und bedürfe keiner ausdrücklichen Offenbarung. Die Erfindung strebe eine "umfassende Lösung" zur Vorhersage des Verschleißes der feuerfesten Auskleidung eines metallurgischen Gefäßes an. Der Begriff "Rechenmodell" war für die Kammer auch im Zusammenhang mit einer Anpassung ("adaptiert") nicht auf ein Modell aus dem Bereich des maschinellen Lernens eingeschränkt. So ist die Tatsache, dass das Modell "adaptiert wird" nicht gleichbedeutend damit, dass das Modell "adaptiv" ist, sich also selbst anpasst bzw. selbstlernend ist. Anspruch 1 war daher nicht auf ein Verfahren zum maschinellen Lernen beschränkt. Für ein solches Rechenmodell gab das Patent weder ein Beispiel noch Anhaltspunkte für die zu modellierenden Zusammenhänge. Schon aus diesem Grund erfüllte der Hauptantrag nicht die Erfordernisse von Art. 83 EPÜ. Eine Vielzahl an Möglichkeiten für die Ausgestaltung eines Rechenmodells bestand. Das vorgetragene Fachwissen enthielt jedoch keine Informationen zu den spezifischen Anforderungen, und das Patent enthielt hierzu auch keine. Daher lag bereits in der Wahl eines konkreten geeigneten Rechenmodells des maschinellen Lernens für die Fachperson eine erhebliche Hürde für die Ausführbarkeit der Erfindung. Selbst wenn, wäre die Fachperson dabei auf sich allein gestellt, aus der Vielzahl an möglichen Eingangsgrößen diejenigen Kombinationen auszuwählen. Schon jeder einzelne derartige Versuch für sich genommen stellte einen erheblichen Aufwand dar. Mangels eines konkret nacharbeitbaren Ausführungsbeispiels als Ausgangspunkt im Patent oder einer sonstigen spezifischen Anleitung, welche Parameter relevant sind, fehlte zudem ein Beleg für die grundsätzliche erfolgreiche Ausführbarkeit der Erfindung mit einem anspruchsgemäß trainierten Rechenmodell. Der Beschwerdeführer trug hierzu vor, es sei nicht erforderlich, weil es gerade das Wesen des maschinellen Lernens sei, dass die Fähigkeit zur Vorhersage der Ausgangsgröße ohne Kenntnis der kausalen Zusammenhänge durch Training selbstlernend erworben werde. Dabei werde der Einfluss irrelevanter Eingangsgrößen von selbst herausgefiltert. Laut der Kammer enthielt die Patentschrift kein einziges konkret nacharbeitbares Ausführungsbeispiel und keine Anhaltspunkte oder Kriterien zur Auswahl geeigneter konkreter Parameter innerhalb der beanspruchten Kategorien. Bezüglich Menge und Qualität der Trainingsdaten (s. auch T 161/18), wurde das Rechenmodell nur mit einem reduzierten Datensatz trainiert. Die vorgetragene Art der Ausführung der Erfindung und der Trainingsdatenerfassung war nicht im Streitpatent offenbart. Der Beschwerdeführer konnte nicht plausibel darlegen, dass das Rechenmodell mit einem solchen eingeschränkten Trainingsdatensatz erfolgreich trainiert werden kann. Somit war die Offenbarung des Patents auch bezüglich des für den Erfolg der Erfindung entscheidenden Aspekts der Trainingsdaten allgemein und unvollständig. Der fehlende Detailgrad dieser Offenbarung im Patent stand in keinem Verhältnis zur Breite der beanspruchten Erfindung und dem entsprechenden Aufwand für eine Fachperson, die Lücken zu füllen, um die Erfindung (über ihre Breite hinweg) ausführen zu können. G 1/03 wurde erfolglos angeführt.
Im Ex-parte-Verfahren T 1539/20 (Verfahren zur Überwachung der Leistung eines Anwendungssystems, das über mehrere mit einem Netz verbundenen Knoten verteilt ist) war Anspruch 1 auf ein computerimplementiertes Verfahren gerichtet, das einen automatisierten Schritt des "Mappings" (bezüglich dieses Begriffs wurden Fragen zu Art. 84 EPÜ aufgeworfen) eines gegebenen verteilten Anwendungssystems auf ein hierarchisches Modell umfasst, wobei die Anmeldung in der ursprünglich eingereichten Fassung jedoch keine Informationen darüber lieferte, wie die Fachperson den "Mapping"-Prozess in Software implementieren könnte. Der Beschwerdeführer machte ferner geltend, dass das Vorliegen nicht funktionsfähiger Ausführungsformen im Anspruch unschädlich sei, sofern die Beschreibung ausreichende Angaben zu den relevanten Kriterien enthalte, anhand deren die funktionsfähigen Ausführungsformen identifiziert werden können (Richtlinien F‑III, 5.1; G 1/03); der Einwand der Kammer gegen Anspruch 1 bestand jedoch nicht darin, dass sein Umfang bestimmte nicht funktionsfähige Ausführungsformen umfasse.
Im Ex-parte-Fall T 1191/19 bezüglich Art. 56 EPÜ erinnerte die Kammer daran, dass die bloße Anwendung eines bekannten Verfahrens für maschinelles Lernen auf Probleme in einem bestimmten Bereich ein allgemeiner Trend in der Technik ist (T 161/18, Nr. 3.6 der Gründe) und als solche nicht erfinderisch sein kann. Die Kammer stellte insbesondere in Bezug auf Art. 83 EPÜ fest, dass die Anmeldung keinen Beispielsatz von Trainings- und Validierungsdaten offenbarte, die das Meta-Learning-Schema als Eingabe benötigt. Die Anmeldung enthielt noch nicht einmal Angaben zur Mindestanzahl der Patienten, von denen Trainingsdaten zusammengestellt werden sollten, um eine aussagekräftige Vorhersage und einen Satz relevanter Parameter zu erhalten. Insbesondere wurden weder die Struktur der als Klassifikatoren verwendeten künstlichen neuronalen Netze noch ihre Topologie, Aktivierungsfunktionen, Endbedingungen oder Lernmechanismen offenbart (mit Verweis auf T 161/18, Nr. 2 der Gründe). Auf der Abstraktionsebene der vorliegenden Anmeldung entsprach die Offenbarung eher einer Aufforderung zu einem Forschungsprogramm. Unter diesen Umständen war die Anwendung des Meta-Learning-Schemas von AX1 (wissenschaftliche Veröffentlichung) zur Lösung der Aufgabe, personalisierte Eingriffe für einen Patienten in Verfahren mit neuronaler Plastizität als Substrat vorherzusagen, für die Fachperson nicht ohne unzumutbaren Aufwand nacharbeitbar.
Im Ex-parte-Fall T 1526/20 bezog sich die Anmeldung auf ein computergestütztes "Echtheitstestverfahren" zur Unterscheidung zwischen echten Gesichtern und Imitationen auf der Grundlage von 2D-Bildern. Nach Auffassung der Kammer habe die Fachperson in Zweifel ziehen müssen, dass das Modell die für eine verlässliche Echtheitsüberprüfung erforderlichen Informationen liefert. Die Anmeldung lieferte jedoch weder eine Begründung für die Richtigkeit dieses Modells noch Ergebnisse, die gezeigt hätten, dass der vorgeschlagene Weg zur Extraktion objektbezogener Informationen korrekt zwischen echten und unechten Objekten unterscheidet.
Im Ex-parte-Fall T 606/21 (Verfahren zur Beurteilung von Vorhersagen der Trajektorien autonomer Fahrzeuge einschließlich der Erzeugung eines tiefen neuronalen Netzes (Deep Neural Network, DNN)) war die Prüfungsabteilung der Ansicht, dass die Anmeldung nicht eindeutig offenbart, wie das DNN-Modell zum Zeitpunkt des Tests eine zuverlässige Ausgabe liefern kann, da es mit einer unvollständigen Eingabe gespeist wird. Die Eingabe zum Zeitpunkt der Prüfung umfasste nur die vorhergesagte, nicht jedoch die tatsächliche Trajektorie. Aus Sicht der Kammer umfasste das Verfahren zwei wesentliche Phasen, wobei die erste Phase die Erstellung eines tiefen neuronalen Netzes (Deep Neural Network, DNN) und das Training dieses DNN durch Eingabe von Trajektorienpaaren betraf, um die Ähnlichkeit dieser Trajektorien zu analysieren und die Genauigkeit dieser Analyse zu verbessern. Die Kammer befand, dass die zweite Phase, die Test- und Bewertungsphase, nicht ausreichend offenbart war.
Im Ex-parte-Fall T 509/18 betraf die Erfindung ein System zur Bestimmung der Wachsamkeit eines Fahrers, das dazu ausgelegt ist, einen Klassifizierungstrainingsprozess zu verwenden, um die Kopfposition und den Augenvektor des Fahrers an mehreren vorbestimmten Punkten innerhalb des Fahrzeugs aufzuzeichnen, und eine Matrix von Zwischenpunktmetriken zur Verwendung für eine Nachschlagetabellen-Klassifizierung des Aufmerksamkeitszustands des Fahrers zu speichern. Nach Ansicht der Kammer lehrte die Anmeldung nicht, wie sich aus der "Matrix von Zwischenpunktmetriken" eine "Nachschlagetabellen-Klassifizierung des Aufmerksamkeitszustands des Fahrers" ableiten lässt, die eine Bestimmung des Aufmerksamkeitszustands des Fahrers zulässt. Die Fachperson wisse nicht, wie sie eine "Nachschlagetabellen-Klassifizierung" erstellt, und folglich auch nicht, wie sie den Aufmerksamkeitszustand des Fahrers auf der Grundlage des Videokamerabilds des tatsächlichen Kopf- und Augenposition des Fahrers zu einem bestimmten Zeitpunkt bestimmt. Der Schritt des Vergleichens des Videokamerabilds mit dieser Nachschlagetabellen-Klassifizierung zur Beurteilung des Aufmerksamkeitszustands des Fahrers erfordere Anweisungen und eine Lehre zur Art der aus einem gegebenen Videokamerabild zu extrahierenden Informationen sowie zu den für den Vergleich anzuwendenden Verfahren und Kriterien; eine solche Offenbarung sei nirgends zu finden.
- T 0048/24
In T 48/24 claim 1 as granted defined a device comprising a "training data generation unit", a "model construction unit" and an "estimation unit". The device was for training and using machine learning for obtaining a "value representing the composition of waste" in a waste pit upon inputting "data of" a captured image of the waste.
The board observed that sufficiency of disclosure had to be assessed for each case individually. The board saw no apparent reason to treat inventions in the field of machine learning differently from other inventions in this regard. According to the board, it went without saying that the implementation of a suitable machine learning model, its training, and whether the trained model can successfully estimate the specified output based on the input parameters as claimed may be important aspects of sufficiency of disclosure of machine learning inventions. However, there were no special requirements and no general rules for assessing whether these aspects were sufficiently disclosed.
With regard to the decisions referred to by the appellant (opponent), the board considered that it was not possible to derive from T 161/18 any general criteria which might be applicable to the present case. Similarly, the board observed that T 1669/21 illustrated the glaring gap between the breadth of the claimed invention and the level of detail in the patent, but did not provide generally applicable criteria required for sufficiently disclosing a machine learning invention. Likewise, the board also pointed out that the considerations in the present case did not imply any universally applicable criteria for assessing sufficiency of disclosure of machine learning inventions.
In the case in hand, the board noted that the patent did not contain a specific example of the claimed invention. That is, it did not disclose any specific combination of certain "data of" captured images and a particular "value representing composition" of the waste in the images, nor did it provide any details on the implementation and training of an exemplary machine learning model, or any information on the achieved accuracy of estimation. In other words, the patent did not contain any concrete, reproducible example of implementation of the invention. Such a specific example was not in itself an absolute requirement for sufficient disclosure, provided that the skilled person was aware of "at least one way" of carrying out the invention in other ways, for example, through the generic disclosure in the patent or the common general knowledge (see R. 42(1)(e) EPC, "using examples where appropriate"). In the present case, however, providing such an example could have demonstrated that the invention was workable at all, at least in this specific case of the example. It could have served as a reference to better understand the claimed invention, its terms and purpose and the achievable or expected level of accuracy.
The board also explained that sufficiency of disclosure required that the invention could be carried out over the whole claimed breadth without undue burden. This requirement had been formulated in decisions across all technical fields (T 149/21). It reflected the general principle that the protection obtained with the patent had to be commensurate with the disclosed teaching. Even if "one way" of performing the invention was disclosed, this would only be sufficient if this disclosure enabled the skilled person to perform the invention over the whole claimed breadth. The patent in suit taught the general idea of using machine learning to infer properties of the waste composition that could be relevant for operating and controlling a waste incineration plant from images of the surface of the waste pit. However, the disclosure was mostly limited to stating a "result to be achieved". The patent left it to the skilled person to select and evaluate combinations of input data and machine learning models for different desired outputs. Each evaluation involved implementing, training and evaluating the selected models. Overall, this resulted in an enormous number of parameter combinations to choose from. Exploring all the possible combinations of these parameters would require a comprehensive research programme and would place an undue burden on the skilled person.
The board concluded that the maintenance of the patent as granted according to the main request was prejudiced by the ground for opposition under Art. 100(b) EPC. Auxiliary requests 1 to 7 were not allowable under Art. 83 EPC either.