一、建設(shè)背景與內(nèi)容
建設(shè)背景
“文化和旅游部公共服務(wù)司、財(cái)務(wù)司關(guān)于做好全國(guó)智慧圖書館體系建設(shè)項(xiàng)目、公共文化云建設(shè)項(xiàng)目實(shí)施工作的通知”
為進(jìn)一步加強(qiáng)公共數(shù)字文化建設(shè),提升全民閱讀、全民藝術(shù)普及數(shù)字化服務(wù)水平,“十四五時(shí)期”文化和旅游部面向公共圖書館系統(tǒng)組織實(shí)施公共文化云建設(shè)
建設(shè)內(nèi)容
、
二、基礎(chǔ)數(shù)字資源建設(shè)
Construction Of Basic Digital Resources
基礎(chǔ)數(shù)字資源建設(shè)內(nèi)容
基礎(chǔ)數(shù)字資源加工系統(tǒng)優(yōu)勢(shì)
基礎(chǔ)數(shù)字資源管理與發(fā)布系統(tǒng)
三、知識(shí)資源細(xì)顆粒度建設(shè)和標(biāo)簽標(biāo)引
Fine Granularity Construction And Label Indexing Of Knowledge Resources
知識(shí)資源細(xì)顆粒度建設(shè)和標(biāo)簽標(biāo)引建設(shè)內(nèi)容
● 數(shù)據(jù)標(biāo)引
特色文獻(xiàn)、古籍、公開課、專題片等資源,進(jìn)行內(nèi)容細(xì)粒度標(biāo)引,對(duì)文本類資源實(shí)現(xiàn)篇章級(jí)、段落級(jí)的標(biāo)引,實(shí)現(xiàn)主題詞、關(guān)鍵詞級(jí)的標(biāo)引建設(shè);對(duì)音視頻類資源做關(guān)鍵詞。
●知識(shí)組織與專題揭示
在資源精細(xì)化標(biāo)引的基礎(chǔ)上,對(duì)各類資源進(jìn)行重新聚類,形成主題化、專題化的分類揭示,從而實(shí)現(xiàn)智能化知識(shí)發(fā)現(xiàn)。
● 新型數(shù)字資源建設(shè)
中華優(yōu)秀傳統(tǒng)文化、革命文化和社會(huì)主義先進(jìn)文化的館藏資源。開展VR/AR等新型數(shù)字資源建設(shè),特色創(chuàng)新性發(fā)展
建設(shè)思路
在全文識(shí)別的基礎(chǔ)上進(jìn)行NLP抽取+人員檢查的方式進(jìn)行細(xì)顆粒度,進(jìn)行NLP標(biāo)引,對(duì)完成的標(biāo)引數(shù)據(jù)條數(shù)進(jìn)行可視化管理 和展示。
自主產(chǎn)權(quán)的核心技術(shù)
● 智能音頻處理引擎
對(duì)音頻中的內(nèi)容進(jìn)行識(shí)別,對(duì)音頻進(jìn)行去噪等預(yù)處理,然后進(jìn)行特征提取并通過訓(xùn)練學(xué)習(xí)建立語(yǔ)義識(shí)別模型,再使用模式匹配方法進(jìn)行識(shí)別
● 智能OCR識(shí)別引擎
漢王基于深度學(xué)習(xí)的OCR識(shí)別引擎,對(duì)于視頻關(guān)鍵幀或滾動(dòng)字幕進(jìn)行提取
● 智能人臉識(shí)別引擎
支持快速、高準(zhǔn)確率的人像檢測(cè)功能,普遍適用于圖片與實(shí)時(shí)視頻流,能夠應(yīng)對(duì)復(fù)雜的光照并支持多種人臉姿態(tài)
● 智能人視頻分析引擎
逐幀讀取視頻,并且對(duì)于每一幀,將執(zhí)行圖像處理以便從該幀中提取特征,包括物體檢測(cè)和物體識(shí)別
● 智能NLP引擎
對(duì)字幕文件、非結(jié)構(gòu)化文件進(jìn)行分詞、詞性標(biāo)注、知識(shí)抽取、等操作實(shí)現(xiàn)自動(dòng)化抽取,并根據(jù)受控詞表進(jìn)行分類標(biāo)引、主題標(biāo)引與關(guān)鍵詞標(biāo)引,形成基于知識(shí)內(nèi)容的語(yǔ)料庫(kù)
知識(shí)可視化展示平臺(tái)
四、基礎(chǔ)支撐平臺(tái)主要建設(shè)任務(wù)
Main Construction Tasks Of Foundation Support Platform
主要任務(wù):為實(shí)現(xiàn)全網(wǎng)知識(shí)內(nèi)容集中倉(cāng)儲(chǔ)系統(tǒng)省級(jí)節(jié)點(diǎn)與國(guó)家圖書館間的互聯(lián)互通、各省級(jí)節(jié)點(diǎn)需要完成以下建設(shè)工作:
● 統(tǒng)一知識(shí)內(nèi)容管理
實(shí)現(xiàn)本省范圍內(nèi)的統(tǒng)一知識(shí)內(nèi)容集成管理;
● 數(shù)字資源管理聯(lián)盟鏈
與國(guó)家圖書館共同完成全國(guó)智慧圖書館數(shù)字資源管理聯(lián)盟鏈的建設(shè),將本省范圍內(nèi)數(shù)字資源進(jìn)行資產(chǎn)化管理;
● 網(wǎng)絡(luò)傳輸通信
建設(shè)并開通省館與國(guó)家圖書館之間網(wǎng)絡(luò)傳輸通道。
基礎(chǔ)支撐平臺(tái)主要建設(shè)內(nèi)容