大明1805正文卷第六一六章機器智能學習創造系統大公三十四年年底,朱迪鈈再次來到朱靖垣的住處,送上了一套最新的計算機和軟件系統。
「機器智能學習創造系統」。
類似於朱靖垣前世的人工智能,不過是一個相對完整的軟件體系。
由於朱靖垣在最開始的時候的提示和引導,朱迪鈈開發模擬世界和各種遊戲的過程中,一直都在孜孜不倦的研發更加真實的機器智能。
不過早期基本上只應用在遊戲中,最近十來年才逐步有了其他的現實應用。
比如說人臉識別、物品分揀、駕駛輔助、智能語音等等。
最近這幾年,這些重要的基礎能力,一直都在不斷地升級換代。
同時在功能範圍上也有了新的突破。
已經可以與用戶智能聊天,可以使用語音控制設備。
可以根據標題和框架生產文章,根據關鍵點和元素生成圖像。
根據語音段落生成智能語音庫,根據遊戲台詞直接生成語音。
還可以修繕和改造現有圖片、視頻、遊戲畫面和聲音。
正在提供越來越多的豐富多彩的智能化應用。
在大公三十四年底,借着新一代小型計算機量產完成,朱迪鈈對這些功能做了一個歸納整理。
朱迪鈈將這些功能統稱為「機器智能學習創造系統」。
朱靖垣看了之後頗為滿意,但是擺弄了一會兒卻輕輕的嘆了口氣。
大明的科技水平,開始在越來越多的方面超過前世了,但是自己也已經真的老了。
今年自己已經六十四歲了。
雖然相比兩個世界的同齡人而言,自己現在的身體狀態其實是很不錯的。
但與自己年輕時候對比,差距就越來越明顯了。
頭上的白髮也越來越多了,身體也越來越不靈活了,腦子也越來越遲鈍了。
朱迪鈈不知道父親為什麼嘆氣。
正想要問問的時候,朱靖垣已經開口吩咐僕人了:
「叫迪鑭過來……」
然後朱靖垣開始問朱迪鈈,他這些智能系統的訓練邏輯。
等到朱迪鑭過來之後,朱靖垣就讓朱迪鈈給他簡單說了這些程序的情況。
然後朱靖垣直接問了一個問題:
「迪鑭,你是大宗伯和刑律院院長,主管文化與法律。
「覺得應該如何處理機器學習的使用的素材的所有權問題。」
朱迪鑭聽了之後隨口就說:
「兒臣覺得很簡單啊,直接付費授權就是了。」
朱靖垣馬上追問:
「機器學習收費的邏輯和理由是什麼?立法是要有說的過去令人信服的道理的。
「如果機器學習需要收費的話,那普通人學習已經公開的書畫作品,是否也需要收費呢?」
朱迪鑭理所當然的說:
「學習本來就要付費的。
「不談學習者自己學習過程中的消耗,例如筆墨紙硯和計算機等等設備。
「也不談上學和聘請老師的費用。
「單純的自行購買學習資料,學習用的原材料和學習內容,本來就是要花錢的。」
朱靖垣伸手指着屏幕上的書畫生成軟件:
「那創作者已經免費在現實中或者互聯網公開的書畫作品,他人學習的時候顯然是不需要付費的。
「這個以別人的書畫作為學習材料的程序,也需要對所有用到的書畫作品付費嗎?
「我記得很多書畫家都在互聯網上免費公開過自己的作品。
「只要不用於盈利行為,通常都會允許別人臨摹學習,甚至還有人會主動指點。」
朱迪鑭稍微整理了一下語言:
「父皇,按照大明現有的法律,創作者主動免費公開的作品,他人不得用於任何以盈利為目的行為。
「這個盈利包括直接和間接的盈利,也包括現在不盈利但未來盈利的行為。
「那些熱心的大師們,通常也不介意他人先模仿自己的作品,再去創作風格類似的不同作品。
「只要對方不照搬他們的設計,另外用於盈利行為也無所謂。
「也覺得是理所當然的做法。
「站在律法的角度看,沒有矛盾的根本原因,還是因為沒有利益衝突。
「免費公開作品的創作者,其實有一種理所當然的,在過去也是基本正確的心態和認知。
「首先是別人除非直接抄襲,否沒辦法簡單利用自己的作品獲利。
「就算是他人學習自己的風格去再創作,也需要需要花費大量精力去完成創作。
「對方要親自動手,一個字一個字的寫,一根線條一根線條的畫。
「對方的創作速度與自己不會有明顯區別。
「絕大部分情況下,學習者的知名度和收益水平,也都不會比原創者更高。
「學習者通常還會尊敬原創者,將對方視為老師。
「這有可能為原創者帶來聲望加成,甚至有可能會帶來能夠直接提供金錢的客戶。
「這種情況下學習者和原創者之間當然沒有矛盾。
「一旦學習者與原創者使用高度相同的風格,但是學習者的作品熱度超過了原創者。
「那雙方的關係就可能會迅速下滑。
「學習者與原創者的風格類似,完成度比原創者自己更高,知名度也會超過原創者。
「就算是能夠提供收益的客戶,也會變成學習者的客戶。
「而不再是自己的潛在客戶了。
「這時候學習者就會變成發揚光大者,原創者就變成了一個點子提供者或者風格創始者。
「就算是在這樣的基礎上,只要學習者仍然尊重原創者,雙方的關係通常也不會變得太差。
「因為發揚光大者會為落寞的原創者提供額外的知名度。
「同時,發揚光大者也是一個人,創作的速度受限於人體的極限。
「在訂單增加的情況下,風格相似的原創者有機會獲得額外的實際利益。
「雙方的利益衝突仍然不明顯,利益仍然是趨同的。
「如果學習者發明了一個機器,可以將原創者的稿件投入進去,瞬間生成無數類似的高質量作品。
「並且用這些大機器生產出來的『廉價工業品』賺大錢。
「那原創者絕對會暴怒。
「所以我們不需要什麼複雜的具有說服力的理由。
「只要規定機器學習需要收費,現有的原創者絕大部分都會直接支持這種規定。
「因為機器很可能會讓他們得不到收益了,自己會被對方的機器迅速取代,失去絕大部分生存空間。
「就像傳統的手工織布工人與機械化紡織機一樣。
「不過,手工紡織工人與機械化紡織機的關係,與書畫創作者和機器學習智能繪圖的關係並不相同。
「手工紡織技術的發明者無法確定,手工紡織工人只是掌握技術的工人。
「工人的紡織過程本身不存在創造性。
「其他人發明和購買機械化紡織機器,與工人並無直接的衝突和侵權行為。
「但是,如果工人自己設計了一種紡織圖案和花紋,而不是傳承多代人的常見圖案和花紋。
「那使用機械化紡織的工廠,在未經工人許可的情況下使用相同圖案,就是法律所禁止的侵權行為。
「而機器學習的對象,恰好都是有創造性的產品,絕大部分都是有版權的產品。
「所以機器學習應該取得學習目標的版權所有人的授權。」
朱靖垣聽完之後看向朱迪鈈:
「老二你認可這個理由嗎?」
朱迪鈈直接說:
「鑭弟……你這樣的說法是沒有道理的,機器學習與紡織工人設計圖案的比喻也是在狡辯。
「機器學習的過程,以及後續再創作的過程,都是與人的學習沒有本質區別的。
「人學習別人的作品,本質上也是將作品元素完全打碎,變成分子乃至原子狀態存進腦子裏面。
「然後再自行組合這些原子狀態的素材,組合出與原作看上去截然不同的作品。
「只是這些原子太小了,根本無法鑑別出於原作的直接雷同點。
「其實只是人類鑑定抄襲的規則基礎上,繼續向下無限細分到人類無法認知為止。
「相同的設計圖案和段落是不是抄襲?相同的人物結構和大綱算不算抄襲?
「相同的抄設計元素和詩句算不算抄襲?相同的線條風格和詞組算不算抄襲?
「相同的顏色範圍搭配和詞庫範圍算不算抄襲呢?
「這樣繼續細分下去,人類學習到最後使用可能是類似的顏色範圍和詞庫。
「機器學習的深度可能比這個更加深入和細化。
「伱用人類法律鑑定抄襲的標準,去鑑定機器學習創造出來的作品,是絕對鑑定不出抄襲來的。
「類比手工織布工匠和機械化紡織機的相同,只能算是使用了類似的棉花和顏色。
「所以為什麼人類學習不算抄襲,機器干同樣的事情就是抄襲?
朱迪鑭笑着說:
「二哥你你可能理解錯了我的意思。
「我沒說機器學習和創造是抄襲,而人類的學習和創造不是抄襲。
「其實按照我自己的觀點,兩者都應該算是抄襲。
「就像二哥你說的,只要鑑定抄襲的標準無限深入,所有的學習都能夠判定為抄襲。
「在這樣的基礎上,任何免費學習過別人的藝術作品的人,都不應該創作任何以盈利為目的的作品。
「想要創造以盈利為目的的作品,本人的所有的學習資料都應該是取得了盈利授權的材料。
「因為只要學習過,顯然就會受到或多或少影響,不然也就不能稱之為學習了。
「是否為抄襲的判斷標準,更加準確的說法是允許抄襲到什麼級別。
「二哥可以參考微積分和相對論的邏輯來理解這個說法。
「在這樣的基礎上,現實中的人類社會和人類創作者,已經經過實際上的社會實踐和法律,默認授權了其他人類擁有特定級別以下的抄襲盈利許可。
「但是,人類還沒有授權機器使用任何級別的抄襲盈利標準。
「比如說,我畫了一幅畫,默認允許二哥你學習畫法。
「我允許你把我的畫的原子結構甚至分子存在自己的腦子裏隨時使用。
「但沒有允許你把他們存在機器裏面供機器使用。
「機器要學習就要另外要授權。
「因為你說了,機器學習的邏輯,與人是相同的,但機器恰好又不是人類。
「機器學習相關又沒有任何現行法律。
「機器學習還沒有大規模出現,我並沒有直接給過它授權,更加沒有給過事實授權。
「甚至沒有給過你使用機器學習的授權。
「現在,我們要擬定相關法律,決定默認授權機器學習到什麼程度。
「我的建議是全部非默認,任何用於機器學習的資料,都必須得到創作者的直接授權。
「這樣做的目的不是為了阻止機器學習繼續進化。
「恰恰是要規範機器學習行業。
「未來是大數據的時代,機器學習的規模必然會越來越大。
「如果不限制機器學習的範圍和規則,必然導致這個產業的混亂發展。
「必然導致機器學習開發者互相抄襲且不可控。
「抄襲數據原子當然不是抄襲,那抄襲數據庫肯定就是抄襲了吧?
「就像照搬一個字庫的範圍不算抄襲,但照搬一本大詞典那就絕對是抄襲了。
「在大數據和機器學習的新時代,數據資料應該是有新的權屬規範。
「任何數據和資料,都應該是有權屬的,都是有價值的。
「我認為這應該是下個時代的時代邏輯。
「有了這樣的基礎規則,有了規範的收費和授權的基本規則。
「相應的數據模型開發者,才有機會將通過有授權的數據,開發出同樣有授權的數據模型。
「進而可以不受額外限制的使用機器生產的產品去盈利。
「否則,任何機器學習最終產生的作品,其著作權歸屬都是模糊和敏感的。
「機器不是人類,所以人類可以不保護機器的著作權,完全不認可機器創作的作品的著作權。
「只有將機器視為人類的機器,創作的作品的著作權屬於其主人所有。
「才能以人類著作權的邏輯獲得保護並盈利。
「但人類想要利用別人的素材盈利,就必須獲得對方的授權了,這樣也就形成了清晰的著作權歸屬。
「透過現象看本質的話,用機械智能完成以前只有人能夠完成的工作,並且講產量和速度提升幾十幾百倍,是又一次的產業革命。
「生產力會再次跨越式的提升,技術能夠覆蓋的產品的生產成本會大幅度下降,由此產生的效益大幅度提升。
「為智能機器成功運行起來提供原料的人,有分享這種生產力提升所帶來的利益的權利。
「不能將個人欣賞學習的授權許可,用於研發和製造任何生產工具。
「這樣數據資料有價論的邏輯也就清晰了。」
朱靖垣聽完之後看向朱迪鈈:
「老二你怎麼看?」
朱迪鈈沉默思考了幾秒鐘,最終慢慢的點着頭說:
「我覺得迪鑭的話有道理……
「用微積分的邏輯來評判和區分學習、模仿、抄襲的界限是個很不錯的理念。
「未來的公共網絡平台上,創作者上傳自己的作品的時候。
「應該有一個是否允許機器學習的選項。
「同時也應該有一個是否使用大數據篩選和推薦信息的選項。」
朱迪鑭聽了馬上附和說:
「我贊成二哥的意見。」
朱靖垣笑着說:
「既然你們哥倆都覺得可行,那這些事情就這麼定了吧。
「不過問題是,你們怎麼判斷一個數據模型,是否用了未經授權的材料來訓練呢?
「在數據分析層面你們有辦法區分嗎?」
朱迪鈈想了想說:
「可以在未經授權的素材中添加一些驗證數據,規避未經許可的機器學習的使用甚至污染數據模型。
「不過……單純依靠技術手段是不行的,無法完全規避違規者的破解和甄別以及反破壞技術。
「所以還是要用社會和制度層面的限制以及事後處置方法……」
朱迪鈈說到這裏看向了弟弟。
朱迪鑭想了想說:
「制度上有兩個方向,一個是默認全部授權,同時默認全部收費。
「目前互聯網上的大規模藝術作品平台,都是朝廷和四大產業集團的官方平台。
「民間廠商和用戶想要自行建立數據模型,只能從這些平台上採集數據。
「所以可以規定,沒有向現有平台之一付費取得授權資格的廠商,都直接按照違規處罰。
「另一個方向,是就由四大產業集團出面,各自設計一套基礎軟件框架。
「相當於一個帶有強制過濾和篩選功能的裝置。
「民間廠商做任何的數據訓練,必須在這個基礎軟件框架之上開發。
「也就是放在這個過濾裝置之內。
「這個過濾程序自動甄別未經授權的材料標記,直接不將未經授權的材料投入訓練過程。
「同時互聯網上應該在授權和未授權的材料上加入專門標記。
「供過這些濾裝置直接識別。
「這些方案可以與二哥的技術方案同步實行。」
朱迪鈈聽了不由得點頭:
「好,識別和反訓練技術是必須開發的。」
朱靖垣也沒有評價兩人的設想,就讓朱迪鈈和朱迪鑭哥倆商量着辦了。