現(xiàn)在位置:主頁(yè) > 家居 > 信息檢索是什么,人工智能基于知識(shí)和智能技術(shù)應(yīng)用

信息檢索是什么,人工智能基于知識(shí)和智能技術(shù)應(yīng)用

作者:編輯 ? 時(shí)間:2018-11-19 ? 瀏覽:人次

一、信息檢索機(jī)制及其發(fā)展

信息檢索Information Retrieval(IR)是一門致力于如何對(duì)大容量信息進(jìn)行有效地存儲(chǔ)與獲取的科學(xué)。廣義的IR通常是指在一定的技術(shù)設(shè)備環(huán)境條件下,對(duì)以某種方式組織的信息資源按其表達(dá)方式,依據(jù)特定用戶的需求,制訂構(gòu)造策略,構(gòu)造檢索表達(dá)方式以實(shí)現(xiàn)檢索目標(biāo)過(guò)程的總稱。而Information Retrieval System(IRS)則是借助計(jì)算機(jī)技術(shù)手段來(lái)存儲(chǔ)信息以滿足日后信息查詢需要的一種檢索工具。這里的信息可以是文本的、視頻或音頻的,但現(xiàn)行的大多數(shù)的信息檢索系統(tǒng)仍只能以存儲(chǔ)與檢索文本的信息和文獻(xiàn)為主。雖然IR 技術(shù)日新月異,但I(xiàn)R的本質(zhì)自始自終都沒(méi)有變,變動(dòng)的只是信息媒體形式、信息檢索系統(tǒng)IRS的吞吐能力以及IRS存儲(chǔ)與匹配的方法而已。

二、人工智能

近30年來(lái)因特網(wǎng)規(guī)模呈幾何級(jí)數(shù)飛速發(fā)展,人們迫切需要適合于網(wǎng)絡(luò)時(shí)代的先進(jìn)的信息檢索技術(shù)。適應(yīng)快速、準(zhǔn)確地檢索有關(guān)信息,并且能夠從大量的網(wǎng)上數(shù)據(jù)中發(fā)現(xiàn)隱含的、有價(jià)值的信息,各種智能檢索技術(shù)、尤其是人工智能技術(shù)浮出水面。人工智能學(xué)科是涉及數(shù)學(xué)、計(jì)算機(jī)科學(xué)、控制論、心理學(xué)、哲學(xué)等學(xué)科的交叉學(xué)科和邊緣學(xué)科,其應(yīng)用領(lǐng)域包括問(wèn)題求解、專家系統(tǒng)、機(jī)器學(xué)習(xí)、模式識(shí)別、自動(dòng)定理證明、自然語(yǔ)言理解、人工神經(jīng)網(wǎng)絡(luò)和智能檢索等。人工智能用于信息檢索主要有基于本體論、神經(jīng)網(wǎng)絡(luò)、遺傳算法、自然語(yǔ)言理解和ID3算法等的智能檢索方法。


信息檢索是什么,人工智能基于知識(shí)和智能技術(shù)應(yīng)用


三、人工智能技術(shù)在信息檢索中的應(yīng)用

人工智能研究機(jī)器模擬人腦所從事的感覺(jué)、認(rèn)知、記憶、學(xué)習(xí)、聯(lián)想、計(jì)算、推理、判斷、決策、抽象、概括等思維活動(dòng),解決人類專家才能處理的復(fù)雜問(wèn)題。它的研究和應(yīng)用領(lǐng)域包括問(wèn)題求解、邏輯推理與定理證明、自然語(yǔ)言理解、自動(dòng)程序設(shè)計(jì)、專家系統(tǒng)、機(jī)器學(xué)習(xí)、模式識(shí)別、機(jī)器視覺(jué)、智能控制、智能檢索,以及智能調(diào)度與指揮等。

(一)信息過(guò)濾技術(shù)

過(guò)濾包括兩方面的含義:一是信息檢索技術(shù)中的過(guò)濾,一般稱為信息過(guò)濾,如搜索引擎過(guò)濾,數(shù)據(jù)挖掘等。二是網(wǎng)絡(luò)安全方面的過(guò)濾。傳統(tǒng)的過(guò)濾主要有基于包的過(guò)濾、基于應(yīng)用的過(guò)濾和基于文本的過(guò)濾等幾種。基于文本的過(guò)濾實(shí)現(xiàn)簡(jiǎn)單,但缺少靈活性,只能對(duì)達(dá)到匹配的文本一刀切,無(wú)法對(duì)文章的語(yǔ)義進(jìn)行分析。引入了人工智能技術(shù)的智能過(guò)濾技術(shù)能夠識(shí)別文檔內(nèi)容實(shí)現(xiàn)智能化的過(guò)濾,同時(shí)能減少網(wǎng)絡(luò)管理員維護(hù)過(guò)濾系統(tǒng)的負(fù)擔(dān)。神經(jīng)網(wǎng)絡(luò)是人工智能范疇中機(jī)器學(xué)習(xí)的一種應(yīng)用,在許多技術(shù)中都有應(yīng)用。

(二)異構(gòu)信息整合與全息檢索

異構(gòu)信息檢索技術(shù)發(fā)展的特點(diǎn)包括支持各種格式化文件,如TBXT、HTML、XML、RTF、MS Office、PDF、PS2/PS、MARC、ISO2709等處理和檢索;支持多語(yǔ)種信息的檢索;支持結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)及非結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)一處理;和關(guān)系數(shù)據(jù)庫(kù)檢索的無(wú)縫集成以及其他開(kāi)放檢索接口的集成等。所謂“全息檢索”的概念就是支持一切格式和方式的檢索,從目前實(shí)踐來(lái)講,發(fā)展到異構(gòu)信息整合檢索的層面,基于自然語(yǔ)言理解的人機(jī)交互以及多媒體信息檢索整合等方面尚有待取得進(jìn)一步突破。

四、應(yīng)用人工智能算法的視頻圖像檢索系統(tǒng)

目前存在一個(gè)新的實(shí)現(xiàn)視頻圖像檢索系統(tǒng)的方法。在這個(gè)系統(tǒng)中,成熟的人工智能算法將被應(yīng)用到視頻圖像的分類、索引與檢索中。在本系統(tǒng)中,視頻圖像的特征選取包括了顏色直方圖的計(jì)算、紋理的分析及應(yīng)用運(yùn)動(dòng)跟蹤算法KLT對(duì)局部視頻數(shù)據(jù)進(jìn)行運(yùn)動(dòng)跟蹤,這些特征構(gòu)成了圖像特征向量。人工智能算法,包括反饋式人工智能神經(jīng)網(wǎng)及自適應(yīng)匹配算法,將會(huì)根據(jù)這些特征向量對(duì)視頻片斷進(jìn)行分類和檢索。系統(tǒng)的工作區(qū)域是一個(gè)二維平面,各種視頻片斷將會(huì)根據(jù)特征向量的不同,被人工智能系統(tǒng)聚類到不同的區(qū)域, 從而實(shí)現(xiàn)視頻片斷的分類和聚集。用戶在查詢的時(shí)候,只要在特定的區(qū)域進(jìn)行放大操作,就可以把視頻檢索限定在一個(gè)較小的區(qū)域,從而快速的實(shí)現(xiàn)視頻片斷的檢索查詢。具體的工作流程可以分為五個(gè)階段:

(一)系統(tǒng)訓(xùn)練階段

在這個(gè)階段中,系統(tǒng)的人工神經(jīng)系統(tǒng)將被初始化,并且在系統(tǒng)與用戶的交互操作中進(jìn)行訓(xùn)練,使之適應(yīng)具體的圖像特征向量,更好地實(shí)現(xiàn)視頻片斷的分類與聚集。

(二)視頻片斷的聚集操作

經(jīng)過(guò)訓(xùn)練的人工神經(jīng)系統(tǒng)將被應(yīng)用到視頻片斷的聚集分類操作中,具有相似的特征向量的視頻片斷將會(huì)被聚集到相近的區(qū)域中,不同的片斷將會(huì)被區(qū)域的遠(yuǎn)近程度來(lái)區(qū)分開(kāi)來(lái)。

(三)視頻片斷的檢索操作

因?yàn)橐曨l片斷在上一階段已經(jīng)進(jìn)行了分類和聚集,用戶只要在局部區(qū)域進(jìn)行放大檢索操作就可以查詢到所需的視頻片斷。從以上的工作流程可以得知,系統(tǒng)對(duì)視頻的分類與檢索有兩個(gè)核心的環(huán)節(jié):第一是特征的提取,即如何選取合適的特征用于表征視頻圖像;第二是分類使用的人工智能算法,即根據(jù)提取的視頻特征快速準(zhǔn)確地對(duì)視頻圖像進(jìn)行分類和檢索。

(四)特征提取算法

本系統(tǒng)應(yīng)用的特征提取算法包括顏色直方圖,用于分析圖像的基本顏色信息,獲得圖像的顏色分布狀況;紋理分析算法,用于圖像模式的分析; 然后對(duì)于局部聚集的圖像應(yīng)用運(yùn)動(dòng)跟蹤算法KLT,進(jìn)一步提高圖像的分類準(zhǔn)確率。

(五)用于分類和檢索的人工智能算法

本系統(tǒng)采用了兩種成熟的人工智能算法:反饋式人工神經(jīng)網(wǎng),利用分類結(jié)果的準(zhǔn)確程度對(duì)系統(tǒng)的參數(shù)進(jìn)行反饋式調(diào)節(jié);自適應(yīng)匹配算法,利用輸入向量對(duì)最相似的系統(tǒng)向量進(jìn)行調(diào)節(jié)。實(shí)驗(yàn)表明自適應(yīng)匹配算法具有高速準(zhǔn)確的效用。

五、人工智能在網(wǎng)絡(luò)信息檢索中的應(yīng)用

人工智能在網(wǎng)絡(luò)信息檢索中的應(yīng)用,主要表現(xiàn)在:如何利用計(jì)算機(jī)軟硬件系統(tǒng)模仿、延伸與擴(kuò)展人類智能的理論、方法和技術(shù)。目前,人工智能在網(wǎng)絡(luò)信息檢索領(lǐng)域的應(yīng)用主要是在以下兩個(gè)方面:

(一)網(wǎng)絡(luò)智能知識(shí)服務(wù)系統(tǒng)

網(wǎng)絡(luò)智能知識(shí)服務(wù)系統(tǒng)的設(shè)計(jì)開(kāi)發(fā)是專門為了解決目前網(wǎng)絡(luò)信息資源浩瀚而獲取難的矛盾。網(wǎng)絡(luò)智能知識(shí)服務(wù)系統(tǒng)可分為知識(shí)采集系統(tǒng)、智能知識(shí)處理系統(tǒng)、智能知識(shí)服務(wù)系統(tǒng)和知識(shí)庫(kù)四部分。

1、知識(shí)采集系統(tǒng)。知識(shí)采集系統(tǒng)的主要任務(wù)是完成資源的加工整理,完成信息到知識(shí)之間的轉(zhuǎn)換功能。

2、智能知識(shí)處理系統(tǒng)。該系統(tǒng)是將采集來(lái)的知識(shí)與知識(shí)庫(kù)中已有的知識(shí)進(jìn)行智能的分類和匹配操作,然后將符合入庫(kù)條件的知識(shí)傳入庫(kù)中。

3、智能知識(shí)庫(kù)存儲(chǔ)系統(tǒng)。這是知識(shí)庫(kù)建設(shè)的最主要組成部分,同時(shí)也關(guān)系到知識(shí)服務(wù)的效果和質(zhì)量。

(二)智能代理技術(shù)

智能代理(Intelligent Agent,IA)技術(shù),起始于20世紀(jì)80年代,是人工智能技術(shù)的一個(gè)重要研究領(lǐng)域目前,國(guó)外從事智能代理技術(shù)研究的不僅有大學(xué)、研究機(jī)構(gòu)和諸多信息技術(shù)公司。并且有些智能代理產(chǎn)品或嵌入智能代理技術(shù)的產(chǎn)品已經(jīng)投入使用,這些情況表明發(fā)展智能代理技術(shù)是一個(gè)趨勢(shì),它將是克服現(xiàn)有網(wǎng)絡(luò)檢索問(wèn)題的有效手段。

1、定義。智能代理是一種軟件程序,它使用戶通過(guò)代理通信協(xié)議進(jìn)行信息交換,以實(shí)現(xiàn)問(wèn)題的自動(dòng)解決。一般來(lái)說(shuō),智能代理具有如下特點(diǎn):智能性、代理性、自治性、主動(dòng)性、移動(dòng)性、協(xié)作性。

2、智能代理的作用。智能代理有著強(qiáng)大的功能,用途也是十分廣泛的,通??煞譃榫W(wǎng)絡(luò)管理、信息管理和優(yōu)化用戶界面。

(三)智能搜索代理的原理

智能搜索代理是智能代理在信息檢索中的一種應(yīng)用,它以用戶需求為先導(dǎo)來(lái)進(jìn)行信息搜集和信息加工,根據(jù)用戶特定的需求以及在一段時(shí)期內(nèi)的偏好為衡量標(biāo)準(zhǔn)來(lái)篩選信息。用戶界面提供友好的自然語(yǔ)言查詢,當(dāng)用戶的查詢請(qǐng)求不明確時(shí),智能搜索代理會(huì)利用知識(shí)庫(kù)中的推理機(jī)制推斷用戶的潛在要求,選擇與用戶習(xí)慣最相近的需求進(jìn)行檢索。

人工智能技術(shù)的發(fā)展是時(shí)代對(duì)社會(huì)智能化需求的體現(xiàn),而人工智能與信息檢索的結(jié)合則是人們對(duì)信息獲取智能化的有益嘗試。在信息檢索系統(tǒng)中納入人工智能技術(shù)將使傳統(tǒng)的信息檢索系統(tǒng)具有更好的用戶界面、更高的檢索效率和更豐富的檢索手段。人工智能技術(shù)的引入正在使傳統(tǒng)的信息檢索系統(tǒng)發(fā)生了巨大的變化。以兩者作為結(jié)合點(diǎn)的智能信息檢索系統(tǒng),也將隨著這兩方面研究的不斷發(fā)展而更加完善、強(qiáng)大。

在不久的將來(lái),多智時(shí)代一定會(huì)徹底走入我們的生活,有興趣入行未來(lái)前沿產(chǎn)業(yè)的朋友,可以收藏多智時(shí)代,及時(shí)獲取人工智能、大數(shù)據(jù)、云計(jì)算和物聯(lián)網(wǎng)的入門知識(shí)和資訊信息,讓我們一起攜手,引領(lǐng)人工智能的未來(lái)

轉(zhuǎn)載請(qǐng)保留原文鏈接:http://eatcooks.com/a/jiaji/2018/1119/18686.html上一篇:上一篇:云計(jì)算是什么,有什么優(yōu)勢(shì),為什么要遷至云端?
下一篇:下一篇:沒(méi)有了