隨著人類逐步進(jìn)入大數(shù)據(jù)時(shí)代,海量的數(shù)據(jù)處理對(duì)現(xiàn)有軟硬件系統(tǒng)提出了更高的要求。利用Hadoop構(gòu)建的處理海量數(shù)據(jù)的分布式系統(tǒng)具有高容錯(cuò)性、可伸縮性、低成本和良好擴(kuò)展性等特點(diǎn)。盡管目前大數(shù)據(jù)技術(shù)還未形成統(tǒng)一標(biāo)準(zhǔn),但業(yè)界已經(jīng)廣泛使用Hadoop分布式系統(tǒng)作為云計(jì)算平臺(tái)。
Hadoop關(guān)鍵技術(shù)主要涉及分布式文件系統(tǒng)HDFS、分布式并行計(jì)算模型MapReduce和分布式數(shù)據(jù)庫HBase。目前互聯(lián)網(wǎng)領(lǐng)域的Web搜索、廣告系統(tǒng)、數(shù)據(jù)分析、機(jī)器學(xué)習(xí)、網(wǎng)頁數(shù)據(jù)挖掘等許多任務(wù)都已經(jīng)在Hadoop平臺(tái)上運(yùn)行。目前,Hadoop平臺(tái)的用戶包括雅虎、臉譜、亞馬遜、百度、阿里巴巴等多家互聯(lián)網(wǎng)巨頭。因此,與Hadoop平臺(tái)相關(guān)的技術(shù)研究也成為計(jì)算機(jī)行業(yè)的研究熱點(diǎn)。
本文基于Hadoop平臺(tái)的專利申請(qǐng)數(shù)據(jù)來自中國專利檢索系統(tǒng)文摘數(shù)據(jù)庫,檢索日期截至2015年6月8日。檢索結(jié)果顯示,申請(qǐng)人共在中國提交了700件專利申請(qǐng)。從圖1可以看出,該領(lǐng)域的專利申請(qǐng)量呈現(xiàn)逐年增長的態(tài)勢(shì)(由于專利申請(qǐng)公開存在滯后性,2014年和2015年的專利申請(qǐng)數(shù)據(jù)并不完全)。2011年之前是Hadoop平臺(tái)的發(fā)展初期,在這期間,與Hadoop平臺(tái)相關(guān)的專利申請(qǐng)量只有18件;2011年,Hadoop平臺(tái)推出了1.0.0版本,標(biāo)志著其已經(jīng)初具生產(chǎn)規(guī)模,自2011年起,與Hadoop平臺(tái)相關(guān)的專利申請(qǐng)量迅速增長,2012年的專利申請(qǐng)量超過100件;2012年至今是Hadoop平臺(tái)的快速發(fā)展期,隨著云計(jì)算的興起,Hadoop作為重要的開源云計(jì)算技術(shù)成為當(dāng)前的研究熱點(diǎn),其專利申請(qǐng)量也呈逐年增長態(tài)勢(shì)。
筆者針對(duì)基于Hadoop平臺(tái)的專利申請(qǐng)人進(jìn)行了分析。該領(lǐng)域排名前十位的申請(qǐng)人均為國內(nèi)企業(yè)和高校,其中,專利申請(qǐng)量最多的是浪潮電子信息產(chǎn)業(yè)股份有限公司,排名第二位和第八位的申請(qǐng)人分別為浪潮(北京)電子信息產(chǎn)業(yè)有限公司及浪潮集團(tuán)有限公司,可見,“浪潮集團(tuán)”在該領(lǐng)域的專利申請(qǐng)量具有明顯優(yōu)勢(shì)。究其原因,這與浪潮集團(tuán)的研發(fā)方向相關(guān),浪潮集團(tuán)是國內(nèi)領(lǐng)先的云計(jì)算、大數(shù)據(jù)服務(wù)商,Hadoop作為重要的云計(jì)算技術(shù),也成為了浪潮集團(tuán)的技術(shù)研發(fā)熱點(diǎn)。浪潮集團(tuán)在該領(lǐng)域的專利申請(qǐng)主要涉及Hadoop平臺(tái)的應(yīng)用研究,如云存儲(chǔ)、數(shù)據(jù)查詢、數(shù)據(jù)分析等。該領(lǐng)域排名前十位的申請(qǐng)人中,國內(nèi)高校占據(jù)了半壁江山,排名第三位、第四位、第五位、第九位、第十位的申請(qǐng)人分別是西安交通大學(xué)、南京大學(xué)、浙江大學(xué)、華中科技大學(xué)和河海大學(xué),這說明Hadoop技術(shù)不僅吸引了企業(yè)的關(guān)注,還引發(fā)了高校的研究熱潮。這些高校提交的專利申請(qǐng)不僅涉及Hadoop平臺(tái)的應(yīng)用研究,如云存儲(chǔ)、具體領(lǐng)域的平臺(tái)搭建等,還涉及Hadoop平臺(tái)的理論研究,如任務(wù)調(diào)度研究、性能優(yōu)化研究等。排名第六位的申請(qǐng)人是百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司,其專利申請(qǐng)主要涉及系統(tǒng)測(cè)試和數(shù)據(jù)處理。排名第七位的申請(qǐng)人是國家電網(wǎng)公司,其專利申請(qǐng)主要涉及與電力領(lǐng)域相關(guān)的Hadoop平臺(tái)的應(yīng)用。
隨著大數(shù)據(jù)時(shí)代的到來,Hadoop的開源性、高容錯(cuò)性、良好擴(kuò)展性等特點(diǎn)使其成為了構(gòu)建云平臺(tái)的首選技術(shù),因此,Hadoop也成為了國內(nèi)企業(yè)和高校的研發(fā)熱點(diǎn),并在該領(lǐng)域進(jìn)行了相應(yīng)的專利布局。筆者認(rèn)為,盡管Hadoop受到了很多人的青睞,但其發(fā)展時(shí)間較短,技術(shù)研究還不夠深入,還有很多值得改進(jìn)的地方。此外,由于Hadoop在國內(nèi)應(yīng)用時(shí)間不長,以Hadoop為基礎(chǔ),設(shè)計(jì)和開發(fā)高效率的數(shù)據(jù)處理平臺(tái)還需要進(jìn)行深入研究。目前,很多用戶在使用Hadoop平臺(tái)時(shí),已經(jīng)開始著手增強(qiáng)和優(yōu)化現(xiàn)有技術(shù),因此,Hadoop的性能優(yōu)化和功能增強(qiáng)等將是未來的主要研究方向。筆者建議,國內(nèi)企業(yè)和高校應(yīng)針對(duì)Hadoop平臺(tái)的性能優(yōu)化、功能增強(qiáng)等加大技術(shù)研發(fā)力度,并有針對(duì)性地進(jìn)行專利布局。(來源:國家知識(shí)產(chǎn)權(quán)局官網(wǎng))