文/北京集佳知識產(chǎn)權代理有限公司 馮柳偉
涉及人工智能的發(fā)明專(zhuān)利申請,有時(shí)需要在權利要求書(shū)中布局用于保護模型訓練過(guò)程的權利要求。其中,權利要求書(shū)應當以說(shuō)明書(shū)為依據,清楚、簡(jiǎn)要地限定要求專(zhuān)利保護的范圍。然而,因模型訓練過(guò)程通常采用循環(huán)迭代方式進(jìn)行實(shí)現,因此如何清楚地撰寫(xiě)出用于保護模型訓練過(guò)程的權利要求是專(zhuān)利代理師在進(jìn)行專(zhuān)利申請代理過(guò)程中需要著(zhù)重考慮的問(wèn)題。本文將結合圖1所示的模型訓練過(guò)程分享一些撰寫(xiě)方式以及這些撰寫(xiě)方式的優(yōu)缺點(diǎn)。
撰寫(xiě)方式一
1.一種模型訓練方法,其特征在于,所述方法包括:
步驟1,獲取樣本數據和所述樣本數據對應的標簽數據;
步驟2,對所述樣本數據進(jìn)行第一處理,得到第一處理結果;
步驟3,利用機器學(xué)習模型對所述第一處理結果進(jìn)行第二處理,得到第二處理結果;
步驟4,判斷是否達到預設停止條件,若否,則依據所述第二處理結果和所述標簽數據之間的差距,更新機器學(xué)習模型中的模型參數,并繼續執行所述步驟1至所述步驟4;若是,則保存或者使用所述機器學(xué)習模型執行相應的數據處理任務(wù)。
撰寫(xiě)方式一的優(yōu)缺點(diǎn)以及建議
優(yōu)點(diǎn):撰寫(xiě)方式一能夠清楚的限定出所需保護的模型訓練過(guò)程。
缺點(diǎn):
?。?)普適性弱,其理由為:如果模型訓練過(guò)程中各個(gè)步驟之間的時(shí)序性比較弱,如一些步驟之間沒(méi)有必然的先后執行順序等,則采用撰寫(xiě)方式一所撰寫(xiě)的權利要求容易無(wú)法覆蓋一些可能的實(shí)施方式,如此導致權利要求的保護范圍受到影響。
?。?)限定性太強,其理由為:①“判斷是否達到預設停止條件”這一步驟的執行時(shí)間通常對模型訓練效果所產(chǎn)生的影響不大,以使這一步驟的執行時(shí)間可以靈活地設置,如設置在更新之前或者設置在更新之后等,從而使得采用撰寫(xiě)方式一所撰寫(xiě)的權利要求容易無(wú)法覆蓋一些可能的實(shí)施方式,如此導致權利要求的保護范圍受到影響。②非首輪訓練過(guò)程中所執行的步驟也是可以靈活設置的,如非首輪訓練過(guò)程中所執行的步驟包括圖1中S1-S4,或者,非首輪訓練過(guò)程中所執行的步驟包括圖1中S2-S4,如此使得采用撰寫(xiě)方式一所撰寫(xiě)的權利要求容易無(wú)法覆蓋一些可能的實(shí)施方式,從而導致權利要求的保護范圍受到影響。
?。?)不清楚,其理由為:因“判斷是否達到預設停止條件”這一技術(shù)特征中出現的“預設停止條件”這一內容屬于自造詞,以使該技術(shù)特征無(wú)法準確地表示出何時(shí)停止訓練,從而使得采用撰寫(xiě)方式一所撰寫(xiě)的權利要求的保護范圍不清楚,進(jìn)而使得日后可能會(huì )面臨一些風(fēng)險。
建議:除非必要,本文不推薦撰寫(xiě)方式一。
撰寫(xiě)方式二
1.一種模型訓練方法,其特征在于,所述方法包括:
獲取樣本數據和所述樣本數據對應的標簽數據;
對所述樣本數據進(jìn)行第一處理,得到第一處理結果;
利用機器學(xué)習模型對所述第一處理結果進(jìn)行第二處理,得到第二處理結果;
依據所述第二處理結果和所述標簽數據之間的差距,更新機器學(xué)習模型中的模型參數,并繼續執行所述獲取樣本數據和所述樣本數據對應的標簽數據的步驟及其后續步驟,直至在達到預設停止條件時(shí),保存或者使用所述機器學(xué)習模型執行相應的數據處理任務(wù)。
撰寫(xiě)方式二的優(yōu)缺點(diǎn)以及建議
優(yōu)點(diǎn):相對于撰寫(xiě)方式一,更簡(jiǎn)要并且滿(mǎn)足“判斷是否達到預設停止條件”這一步驟的執行時(shí)間的靈活性要求。
缺點(diǎn):
?。?)不清楚,其理由為:①因“繼續執行所述獲取樣本數據和所述樣本數據對應的標簽數據的步驟及其后續步驟”這一技術(shù)特征中出現的“及其后續步驟”這一內容比較含糊,如“其”這個(gè)字指代誰(shuí)、“后續步驟”是指哪些步驟等,以使采用撰寫(xiě)方式二所撰寫(xiě)的權利要求的保護范圍不清楚,從而使得日后可能會(huì )面臨一些風(fēng)險。②因“在達到預設停止條件時(shí)”這一技術(shù)特征中出現的“預設停止條件”這一內容屬于自造詞,以使該技術(shù)特征無(wú)法準確地表示出何時(shí)停止訓練,從而使得采用撰寫(xiě)方式二所撰寫(xiě)的權利要求的保護范圍不清楚,進(jìn)而使得日后可能會(huì )面臨一些風(fēng)險。
?。?)限定性強,其理由為:非首輪訓練過(guò)程中所執行的步驟也是可以靈活設置的,如非首輪訓練過(guò)程中所執行的步驟包括圖1中S1-S4,或者,非首輪訓練過(guò)程中所執行的步驟包括圖1中S2-S4等,如此使得采用撰寫(xiě)方式二所撰寫(xiě)的權利要求容易無(wú)法覆蓋一些可能的實(shí)施方式,從而導致權利要求的保護范圍受到影響。
建議:除非必要,本文不推薦撰寫(xiě)方式二。
撰寫(xiě)方式三
1.一種模型訓練方法,其特征在于,所述方法包括:
獲取樣本數據和所述樣本數據對應的標簽數據;
對所述樣本數據進(jìn)行第一處理,得到第一處理結果;
利用機器學(xué)習模型對所述第一處理結果進(jìn)行第二處理,得到第二處理結果;
依據所述第二處理結果和所述標簽數據之間的差距,更新機器學(xué)習模型中的模型參數,并繼續執行所述獲取樣本數據和所述樣本數據對應的標簽數據的步驟,直至在達到預設停止條件時(shí),保存或者使用所述機器學(xué)習模型執行相應的數據處理任務(wù)。
撰寫(xiě)方式三的優(yōu)缺點(diǎn)以及建議
優(yōu)點(diǎn):相對于撰寫(xiě)方式一,更簡(jiǎn)要并且滿(mǎn)足“判斷是否達到預設停止條件”這一步驟的執行時(shí)間的靈活性要求;相對于撰寫(xiě)方式二,克服了因“及其后續步驟”這一內容所導致的不清楚。
缺點(diǎn):
?。?)不清楚,其理由為:因“在達到預設停止條件時(shí)”這一技術(shù)特征中出現的“預設停止條件”這一內容屬于自造詞,以使該技術(shù)特征無(wú)法準確地表示出何時(shí)停止訓練,從而使得采用撰寫(xiě)方式三所撰寫(xiě)的權利要求的保護范圍不清楚,進(jìn)而使得日后可能會(huì )面臨一些風(fēng)險。
?。?)限定性強,其理由為:非首輪訓練過(guò)程中所執行的步驟也是可以靈活設置的,如非首輪訓練過(guò)程中所執行的步驟包括圖1中S1-S4,或者,非首輪訓練過(guò)程中所執行的步驟包括圖1中S2-S4等,如此使得采用撰寫(xiě)方式三所撰寫(xiě)的權利要求容易無(wú)法覆蓋一些可能的實(shí)施方式,從而導致權利要求的保護范圍受到影響。
建議:相較于撰寫(xiě)方式一和撰寫(xiě)方式二,本文更推薦撰寫(xiě)方式三。
基于上文撰寫(xiě)方式一、撰寫(xiě)方式二以及撰寫(xiě)方式三的相關(guān)內容可知,這三種方式的部分或者全部缺點(diǎn)均來(lái)自于用于限定迭代循環(huán)這一過(guò)程的技術(shù)特征。然而,因通過(guò)迭代循環(huán)方式實(shí)現模型訓練是一種比較常規的技術(shù)手段,以使涉及人工智能的發(fā)明專(zhuān)利申請的發(fā)明點(diǎn)通常很少出現在迭代循環(huán)方式上,而是大部分出現在其他地方,如類(lèi)似于圖1中S2這類(lèi)的用于對樣本數據進(jìn)行前期處理的步驟和/或類(lèi)似于圖1中S3這類(lèi)的用于借助模型進(jìn)行數據處理的步驟等地方;還因這些地方通常會(huì )出現在某一輪訓練過(guò)程或者每一輪訓練過(guò)程,故可以通過(guò)限定一輪訓練過(guò)程的方式進(jìn)行發(fā)明點(diǎn)保護?;诖?,本文給出了一種新的撰寫(xiě)方式,也就是,下文撰寫(xiě)方式四。
撰寫(xiě)方式四
1.一種模型更新方法,其特征在于,所述方法包括:
獲取樣本數據和所述樣本數據對應的標簽數據;
對所述樣本數據進(jìn)行第一處理,得到第一處理結果;
利用機器學(xué)習模型對所述第一處理結果進(jìn)行第二處理,得到第二處理結果;
依據所述第二處理結果和所述標簽數據之間的差距,更新機器學(xué)習模型中的模型參數。
撰寫(xiě)方式四的優(yōu)缺點(diǎn)以及建議
優(yōu)點(diǎn):
?。?)相對于撰寫(xiě)方式一至撰寫(xiě)方式三,更簡(jiǎn)要并且克服了這些撰寫(xiě)方式的所有缺點(diǎn)。
?。?)擴大了保護范圍,其理由為:因“一種模型更新方法”這一技術(shù)特征只是限定了權利要求所保護的方法用于實(shí)現模型更新處理,未限定應用領(lǐng)域必須是模型訓練這一領(lǐng)域,以使該權利要求所保護的方法適用于任一具有模型更新需求的領(lǐng)域。
缺點(diǎn):撰寫(xiě)方式四不適于保護迭代更新方式方面的發(fā)明點(diǎn)。
建議:相較于撰寫(xiě)方式一、撰寫(xiě)方式二、以及撰寫(xiě)方式三,本文更推薦撰寫(xiě)方式四。
另外,對于上文撰寫(xiě)方式一、撰寫(xiě)方式二、撰寫(xiě)方式三以及撰寫(xiě)方式四來(lái)說(shuō),這四種撰寫(xiě)方式均涉及了“更新機器學(xué)習模型中的模型參數”這一技術(shù)特征,而且這個(gè)技術(shù)特征能夠準確地限定出模型更新時(shí)需要更新什么信息。然而,隨著(zhù)人工智能技術(shù)的不斷發(fā)展,模型的更新不再局限于通過(guò)參數更新的方式進(jìn)行實(shí)現,還可以通過(guò)增加網(wǎng)絡(luò )模塊的方式,如lora微調進(jìn)行實(shí)現,以使“更新機器學(xué)習模型中的模型參數”這一技術(shù)特征無(wú)法涵蓋這種新增的模型更新方式?;诖?,本文給出了一種新的撰寫(xiě)方式,也就是,下文撰寫(xiě)方式五。
撰寫(xiě)方式五
1.一種模型更新方法,其特征在于,所述方法包括:
獲取樣本數據和所述樣本數據對應的標簽數據;
對所述樣本數據進(jìn)行第一處理,得到第一處理結果;
利用機器學(xué)習模型對所述第一處理結果進(jìn)行第二處理,得到第二處理結果;
依據所述第二處理結果和所述標簽數據之間的差距,更新機器學(xué)習模型。
撰寫(xiě)方式五的優(yōu)缺點(diǎn)以及建議
優(yōu)點(diǎn):克服了上文“更新機器學(xué)習模型中的模型參數”這一技術(shù)特征所導致的缺陷,如無(wú)法涵蓋通過(guò)增加網(wǎng)絡(luò )模塊方式實(shí)現模型更新的技術(shù)方案。
缺點(diǎn):撰寫(xiě)方式五不適于保護迭代更新方式方面的發(fā)明點(diǎn)。
建議:相較于撰寫(xiě)方式一、撰寫(xiě)方式二、撰寫(xiě)方式三以及撰寫(xiě)方式四,本文更推薦撰寫(xiě)方式五。
基于上文五種撰寫(xiě)方式的相關(guān)內容可知,對于涉及人工智能的發(fā)明專(zhuān)利申請來(lái)說(shuō),如果該申請的發(fā)明點(diǎn)能夠借助一輪訓練過(guò)程說(shuō)清楚,則可以采用上文撰寫(xiě)方式五撰寫(xiě)該申請的獨立權利要求;如果該申請的發(fā)明點(diǎn)必須借助多輪訓練過(guò)程才能說(shuō)清楚,則可以?xún)?yōu)先選擇類(lèi)似于上文撰寫(xiě)方式三的撰寫(xiě)方式撰寫(xiě)該申請的獨立權利要求;如果該申請的發(fā)明點(diǎn)不涉及模型更新內容,則可以選擇使用“更新機器學(xué)習模型”這一技術(shù)特征撰寫(xiě)該申請的獨立權利要求。
以上是筆者的一些個(gè)人經(jīng)驗總結,如有不妥之處,還請讀者批評指教。