成人精品av一区二区三区_亚洲国产精品久久无码中文字_欧美黑人xxxx性高清版_欧美老熟妇xb水多毛多

網(wǎng)絡(luò)輿情分析系統(tǒng)8篇

時(shí)間:2023-03-15 14:58:30

緒論:在尋找寫作靈感嗎?愛(ài)發(fā)表網(wǎng)為您精選了8篇網(wǎng)絡(luò)輿情分析系統(tǒng),愿這些內(nèi)容能夠啟迪您的思維,激發(fā)您的創(chuàng)作熱情,歡迎您的閱讀與分享!

網(wǎng)絡(luò)輿情分析系統(tǒng)

篇1

關(guān)鍵詞:網(wǎng)絡(luò)英語(yǔ)學(xué)習(xí)生態(tài)系統(tǒng);計(jì)算機(jī)網(wǎng)絡(luò);情感交互

當(dāng)計(jì)算機(jī)播放某多媒體程序的時(shí)候,編程人員可以他的思想及情感發(fā)出指令控制該程序的運(yùn)行,而不是程序單方面執(zhí)行下去,程序在接受到編程人員相應(yīng)的指令后而相應(yīng)的做出反應(yīng),這一過(guò)程及行為,我們稱之為情感交互

人與人之間的直接溝通一般是在雙向交互的情況下實(shí)現(xiàn)的,比方說(shuō)學(xué)校的一些具體的管理行為、教學(xué)行為及其它種種交往行為。而借助傳統(tǒng)媒體實(shí)現(xiàn)的師生溝通大多數(shù)是章向交互的,是教師到學(xué)生的,學(xué)生的反饋行為一般并不通過(guò)傳統(tǒng)媒體來(lái)實(shí)現(xiàn)。在這個(gè)主面,網(wǎng)絡(luò)媒體的不同之處在于,借助它可以實(shí)現(xiàn)師生間的雙向交互,甚至可以方便地實(shí)現(xiàn)學(xué)生與校園圍墻以外世界的雙向交流。

在當(dāng)前的網(wǎng)絡(luò)教學(xué)嘗試中,師生之間的情感溝通被忽視。學(xué)生與教師遠(yuǎn)遠(yuǎn)相離,客觀上使師生之間的感情溝通比較困難,可是并不見(jiàn)有主動(dòng)的工作去彌補(bǔ)這些缺陷。在這種情況下,學(xué)生很難與教師產(chǎn)生情感上的共鳴,很難產(chǎn)生對(duì)教師的喜歡、喜愛(ài)乃至不很過(guò)分的“崇拜”,無(wú)法指望得到這種感情對(duì)學(xué)習(xí)產(chǎn)生積極的影響,更不用說(shuō)在學(xué)生的人格成長(zhǎng)方面,沒(méi)有教師的行為作風(fēng)的潛移默化的影響。筆者認(rèn)為,這就是教師對(duì)學(xué)生可以產(chǎn)生意義的第三個(gè)方面。這種對(duì)教師的行為“導(dǎo)航”和情感溝通對(duì)于促進(jìn)學(xué)生學(xué)習(xí)的必要性的認(rèn)識(shí)缺陷,在近期的網(wǎng)絡(luò)教學(xué)試點(diǎn)工作中一直部分地存在著,直到2000年的長(zhǎng)沙會(huì)議也沒(méi)有看到任何轉(zhuǎn)機(jī)。

在新的媒體群落條件下,教師除借助傳統(tǒng)媒體向?qū)W生遞送知識(shí)信息外,還增加了借助網(wǎng)絡(luò)媒體與學(xué)生進(jìn)一步溝通的機(jī)會(huì)。理論上,這些溝通作為通常面對(duì)面溝通的補(bǔ)充,也可以產(chǎn)生多方面的意義,比方說(shuō),可以指導(dǎo)學(xué)生的學(xué)習(xí),也可以進(jìn)一步溝通感情,增進(jìn)師生之間的了解,使教師對(duì)學(xué)生產(chǎn)生更多人格等方面的影響,促進(jìn)學(xué)生全面發(fā)展。夫子云:“師者,傳道、授業(yè)、解惑也”。這個(gè)道,即有為人之道與為學(xué)之道的雙重含義。在此作一個(gè)小結(jié),在教學(xué)活動(dòng)中,教師與學(xué)生的溝通可以認(rèn)為在三個(gè)層面上實(shí)現(xiàn)意義:其一,情感溝通;其二、管理溝通;其三、知識(shí)導(dǎo)航與傳授溝通。

網(wǎng)絡(luò)教學(xué)發(fā)展的最終制約瓶頸是教師的注意力資源。當(dāng)前,一個(gè)不負(fù)責(zé)任的流行觀念就是簡(jiǎn)單地將渠道的豐富與溝通的增進(jìn)對(duì)等起來(lái),甚至混淆為一個(gè)概念。產(chǎn)生的觀點(diǎn)就是網(wǎng)絡(luò)媒體可以幾乎是無(wú)限制地?cái)U(kuò)大招生人數(shù),提高教學(xué)效率。估我國(guó),教育事業(yè)的相對(duì)落后使得我們急于尋找效率更高,受益面更大的教學(xué)模式。這種心情是可以理解。但是經(jīng)驗(yàn)告訴我們,指望借助某種先進(jìn)媒體的作用使教育的質(zhì)量和數(shù)量在一夜之間“趕超英美”是不現(xiàn)實(shí)的,無(wú)疑是式的天真幻想。決定教學(xué)規(guī)模及教育水平的最終制約瓶頸是教師的注意力資源,是教師的質(zhì)量與數(shù)量,與之相對(duì)應(yīng)的是社會(huì)的教育投入。

教師已經(jīng)不能無(wú)視網(wǎng)絡(luò)媒體的沖擊,網(wǎng)絡(luò)上源源不斷的信息和源源不斷的新理念迫使教師必須有所改變,在這個(gè)改變過(guò)程中,教育思想的改變也自然而然地發(fā)生了。這正是技術(shù)進(jìn)步推動(dòng)思想進(jìn)步的一個(gè)生動(dòng)例子。所幸的是,網(wǎng)絡(luò)媒體并不僅僅是使教師陷入被動(dòng)狀態(tài),它同樣為教師準(zhǔn)備了足夠的自我發(fā)展空間,為教師的繼續(xù)學(xué)習(xí)和提高業(yè)務(wù)水平提供了更充分的條件。網(wǎng)絡(luò)媒體呼喚教師在新的教育思想指導(dǎo)下進(jìn)行新的教學(xué)方法的嘗試,比方說(shuō),教師不僅僅作為知識(shí)的傳授者,更多地作為學(xué)習(xí)的導(dǎo)航者,也作為網(wǎng)絡(luò)海洋中知識(shí)的導(dǎo)航者。

教師作為知識(shí)的傳授者,并不僅僅是刻板地把知識(shí)灌輸給學(xué)生,而是在了解學(xué)生的基礎(chǔ)上將知識(shí)恰當(dāng)有序地傳授給學(xué)生。在新的教育理念下,教師更多地扮演引導(dǎo)者的角色,即以引導(dǎo)為軸線,以知識(shí)傳授為內(nèi)容。就是說(shuō),教師的作用在教學(xué)活動(dòng)方面也可以分為兩個(gè)部分,一是作為知識(shí)的提供者和傳授者,二是作為知識(shí)的導(dǎo)航者。這第二個(gè)部分的作用正是當(dāng)前流行的教育思想所要強(qiáng)調(diào)的。

教師的另外一層管理意義是他在教學(xué)活動(dòng)中同時(shí)在承擔(dān)著具體學(xué)習(xí)過(guò)程中的“管理”任務(wù)。在課堂上:教師對(duì)學(xué)生就是一個(gè)客觀的近在咫尺的行為約束,這個(gè)約束在規(guī)定著學(xué)生在課堂上可以干什么,不可以干什么;教師隨時(shí)對(duì)良好的主動(dòng)積極的學(xué)習(xí)態(tài)度予以鼓勵(lì),隨時(shí)對(duì)出現(xiàn)的異常現(xiàn)象進(jìn)行分析判斷,然后按照自己對(duì)教育思想及管理思想的理解予以處理。教師深入課堂的管理是整個(gè)學(xué)校管理活動(dòng)的重要末梢,忽視這個(gè)末梢,管理活動(dòng)將是不完善的和低效的,不能保證學(xué)習(xí)活動(dòng)高效正常地進(jìn)行。這種觀念 在一般的教學(xué)理論中已經(jīng)是老生常談,但筆者注意到,在過(guò)去的有關(guān)網(wǎng)絡(luò)教學(xué)的討論中,這個(gè)問(wèn)題談得太少且經(jīng)常被忽視。

總之,如上所述,教師資源所產(chǎn)生的意義中應(yīng)該包括有管理意義上的部分,還必然有教學(xué)意義上的部分。教師在教學(xué)方面的作用也因網(wǎng)絡(luò)的出現(xiàn)而受到?jīng)_擊。新的媒介帶來(lái)的新觀念首先對(duì)一些教師的陳舊教育思想和教學(xué)習(xí)慣形成沖擊,使教師對(duì)教學(xué)信息的壟斷地位受到威脅,近使教師不得不重新思考,重新為自己定位,調(diào)整自己的教育思想使之與新的條件相適應(yīng);另一方面,新的媒體群落也為教師提供了一個(gè)更為廣闊的學(xué)習(xí)和提高的空間,提供了更為豐富的教學(xué)信息的表達(dá)手段,使他的教學(xué)活動(dòng)更能豐富多彩、引人入勝,更易于培養(yǎng)和激發(fā)學(xué)生的創(chuàng)造力。

參考文獻(xiàn):

篇2

【關(guān)鍵字】 無(wú)線傳感器網(wǎng)絡(luò) 節(jié)點(diǎn) 資源 能耗 帶寬 路由 路徑

一、無(wú)線傳感器網(wǎng)絡(luò)中基于無(wú)線節(jié)點(diǎn)資源的通信路由研究的技術(shù)分支詳述

筆者發(fā)現(xiàn)現(xiàn)有專利申請(qǐng)是基于傳統(tǒng)類型的協(xié)議進(jìn)行的多個(gè)分支的改進(jìn),經(jīng)過(guò)專利統(tǒng)計(jì)歸納,無(wú)線傳感器網(wǎng)絡(luò)中基于節(jié)點(diǎn)資源的通信路由研究主要分為以下四個(gè)技術(shù)分支,均衡網(wǎng)絡(luò)能耗的路由、分簇及簇首選擇的路由、降低時(shí)延的路由、安全可信的路由。

1.1.均衡網(wǎng)絡(luò)能耗的路由分支

由于我國(guó)關(guān)于無(wú)線傳感器網(wǎng)絡(luò)的研究起步在2009年左右,所以無(wú)線傳感網(wǎng)路由方面的研究也是如此,利爾達(dá)科技有限公司在2010年提出了一種基于連接的無(wú)線傳感器網(wǎng)絡(luò)擴(kuò)散路由算法,申請(qǐng)?zhí)枮镃N201010204302。

隨后高等院校也開(kāi)始這方面的申請(qǐng),比如有東南大學(xué)申請(qǐng)?zhí)枮镃N201210052390、南京大學(xué)申請(qǐng)?zhí)枮镃N201210398925的專利申請(qǐng),并且南京大學(xué)的該申請(qǐng)是在分簇網(wǎng)絡(luò)的基礎(chǔ)之上考慮了能量均衡,有效地延長(zhǎng)了網(wǎng)絡(luò)生存時(shí)間。

在大量的高等院校和公司的申請(qǐng)同時(shí),也有踴躍的個(gè)人申請(qǐng),比如賀靜個(gè)人在2012年提出了一種面向無(wú)線傳感網(wǎng)的能量高效洪泛方法,申請(qǐng)?zhí)枮镃N201210510337,具體涉及一種在無(wú)線傳感器網(wǎng)絡(luò)中利用局部范圍節(jié)點(diǎn)能量次序信息,實(shí)現(xiàn)廣播樹(shù)構(gòu)造方法,使得均衡使用節(jié)點(diǎn)能量。

1.2分簇及簇首選擇的路由分支

對(duì)于該分支,本領(lǐng)域技術(shù)人員關(guān)注如何在無(wú)線傳感器網(wǎng)絡(luò)中更合理的分簇以及利用選擇的簇首進(jìn)行高效的路由。在2012年,中國(guó)聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司就如何利用簇首節(jié)點(diǎn)進(jìn)行路由的建立,提出專利申請(qǐng)?zhí)枮镃N201210116856的申請(qǐng)。

隨后,國(guó)內(nèi)的科研院校陸續(xù)申請(qǐng)了關(guān)于更多兼顧網(wǎng)絡(luò)多種性能的簇首選擇路由算法,比如,中國(guó)科學(xué)院信息工程研究所,考慮了在進(jìn)行高效路由時(shí)如何更好的選擇簇首節(jié)點(diǎn)并兼顧均衡網(wǎng)絡(luò)能耗,提出了申請(qǐng)?zhí)枮镃N201210333412的申請(qǐng)。

對(duì)于后續(xù)的申請(qǐng)量,公司申請(qǐng)也在陸續(xù)增加,比如中國(guó)聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司又繼續(xù)針對(duì)兼顧網(wǎng)絡(luò)節(jié)點(diǎn)的狀態(tài)進(jìn)行基于簇首的路由算法進(jìn)行了研究并申請(qǐng)了專利,申請(qǐng)?zhí)枮镃N201310633716。

在2012年至2014年,出現(xiàn)了大量的分簇及簇首選擇的路由分支的專利申請(qǐng),國(guó)內(nèi)主要申請(qǐng)人為高等院校與少數(shù)公司,比如北京郵電大學(xué)、南京郵電大學(xué)、上海交通大學(xué)以及華為技術(shù)有限公司、中國(guó)聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司,國(guó)外主要申請(qǐng)人為富士通株式會(huì)社、北電網(wǎng)絡(luò)有限公司、英特爾公司。

1.3 降低時(shí)延的路由分支

無(wú)線傳感器網(wǎng)絡(luò)的某些應(yīng)用通常對(duì)網(wǎng)絡(luò)的實(shí)時(shí)性都有較高的要求,因此,在降低時(shí)延的路由分支在2010年以來(lái)陸續(xù)出現(xiàn)了許多專利申請(qǐng),但是較于分簇及簇首選擇的路由分支,該分支的申請(qǐng)量還是處于弱勢(shì)。

并且該分支的專利申請(qǐng)量較為集中在高等院校,比如寧波城市職業(yè)技術(shù)學(xué)院提出了申請(qǐng)?zhí)枮镃N 201010543262,發(fā)明名稱為“一種用于無(wú)線傳感器網(wǎng)絡(luò)的實(shí)時(shí)通信路由方法”的專利申請(qǐng),并已經(jīng)授權(quán)。

分析該分支專利申請(qǐng)量較少的原因?yàn)?,在其他分支的專利申?qǐng)多少都涵蓋了時(shí)延的考慮,因此,通過(guò)去重之后的統(tǒng)計(jì)分析該技術(shù)分支的申請(qǐng)量表現(xiàn)較少,實(shí)際上,涉及到時(shí)延的路由專利申請(qǐng)量比較多,幾乎占據(jù)整個(gè)無(wú)線傳感器網(wǎng)絡(luò)路由的一半以上。

1.4 安全可信的路由分支

無(wú)線傳感器網(wǎng)絡(luò)建立安全可信的路由是本領(lǐng)域技術(shù)人員關(guān)注的重要分支,從2011年開(kāi)始,逐漸有比較成熟的專利申請(qǐng),并且大多數(shù)申請(qǐng)人涉及高等院校,比如在2012年,申請(qǐng)人重慶郵電大學(xué),提出了基于動(dòng)態(tài)探測(cè)的無(wú)線傳感器網(wǎng)絡(luò)安全路由的方法,該發(fā)明采用逐點(diǎn)驗(yàn)證的方式,顯著提高路由安全性,同時(shí)顯著減少能耗。

2013年山東大學(xué)提出一種基于拓?fù)浣Y(jié)構(gòu)的無(wú)線傳感網(wǎng)絡(luò)的新型信任管理系統(tǒng)的信任路由算法,申請(qǐng)?zhí)枮镃N201310148141,它考慮節(jié)點(diǎn)安全性對(duì)路由選擇的影響,依據(jù)節(jié)點(diǎn)的可信度是否滿足約束條件來(lái)形成有效路徑,更好地保證無(wú)線數(shù)據(jù)通信的安全。

在2013年至2014年涌現(xiàn)了大量的院校申請(qǐng)人,比如中國(guó)人民理工大學(xué)、西北工業(yè)大學(xué)等對(duì)該分支的路由申請(qǐng)了相關(guān)專利。

二、無(wú)線傳感器網(wǎng)絡(luò)中基于無(wú)線節(jié)點(diǎn)資源的通信路由研究的技術(shù)分支發(fā)展態(tài)勢(shì)

國(guó)內(nèi)無(wú)線傳感器網(wǎng)絡(luò)中基于無(wú)線節(jié)點(diǎn)資源的通信路由研究中上述4種技術(shù)分支的專利申請(qǐng)趨勢(shì)如圖1所示。

從圖1可以看到,對(duì)于均衡網(wǎng)絡(luò)能耗的路由分支在2008年開(kāi)始至2014年,連續(xù)有較多的申請(qǐng)量,數(shù)量最多的集中在2010年至2014年,可見(jiàn)在隨著無(wú)線傳感器網(wǎng)絡(luò)研究的起步,該技術(shù)分支不斷得到技術(shù)人員的研究與申請(qǐng)。

分簇及簇首選擇的路由分支在整個(gè)無(wú)線傳感器網(wǎng)絡(luò)路由專利申請(qǐng)量中占有重要的比例,表明適合于無(wú)線傳感器網(wǎng)絡(luò)的分簇結(jié)構(gòu),是該技術(shù)領(lǐng)域較為常用的網(wǎng)絡(luò)結(jié)構(gòu),因此基于該網(wǎng)絡(luò)結(jié)構(gòu)的路由研發(fā)分支一直是本領(lǐng)域申請(qǐng)人較為關(guān)注和投入精力較多的技術(shù)分支。

降低時(shí)延的路由分支在2005年至2014年,每年都持續(xù)有申請(qǐng)量,表明該技術(shù)分支一直是本領(lǐng)域技術(shù)人員關(guān)注的領(lǐng)域,盡管每年的申請(qǐng)量不多,但是集中在2011年至2013年,申請(qǐng)人加大了該分支的研究與申請(qǐng),表明該技術(shù)分支漸漸成為申請(qǐng)人的重點(diǎn)關(guān)注。

安全可信的路由分支在整體的申請(qǐng)量上還不是很多,技術(shù)還不夠成熟,但是申請(qǐng)量漸漸集中在2012至2013年,引起了申請(qǐng)人的注意,可能成為今后幾年的申請(qǐng)重點(diǎn)分支,可以作為后續(xù)專利申請(qǐng)分析的關(guān)注方向。

篇3

關(guān)鍵詞:流星余跡通信;網(wǎng)絡(luò)結(jié)構(gòu);混合自動(dòng)請(qǐng)求重傳;時(shí)延模型;排隊(duì)論

中圖分類號(hào):TP391.9

文獻(xiàn)標(biāo)志碼:A

文章編號(hào):1001-9081(2016)11-3039-05

0 引言

流星余跡通信作為最低限度應(yīng)急通信保障的一種有效手段,在通信領(lǐng)域中占有重要地位。流星余跡信道突發(fā)性強(qiáng)、通信距離遠(yuǎn)、傳輸速率低,而且信道具有時(shí)變衰落特性[1],這使得數(shù)據(jù)傳輸變得不可靠。在對(duì)流星余跡通信系統(tǒng)進(jìn)行仿真的過(guò)程中,如何采用合適的傳輸機(jī)制以保證通信鏈路中的可靠傳輸,同時(shí)最大化傳輸效率,減少傳輸時(shí)延,是值得深入研究的一個(gè)問(wèn)題。

自動(dòng)請(qǐng)求重傳(Automatic Repeat Request, ARQ)機(jī)制是被廣泛應(yīng)用于無(wú)線通信領(lǐng)域的差錯(cuò)控制技術(shù)[2]。近年來(lái),將前向糾錯(cuò)控制(Forward Error Correction, FEC)機(jī)制與ARQ結(jié)合起來(lái)的混合自動(dòng)請(qǐng)求重傳(Hybrid Automatic Repeat Request, HARQ)技術(shù)得到了廣泛研究[3],并被應(yīng)用于流星余跡通信系統(tǒng),極大地提高了流星余跡通信的可靠性和傳輸效率。研究流星余跡通信系統(tǒng)的時(shí)延性能,一個(gè)重要的方面就是分析HARQ傳輸機(jī)制對(duì)時(shí)延性能的影響。

目前,國(guó)內(nèi)外對(duì)流星余跡通信中HARQ機(jī)制的研究[4-5]不夠充分,尤其是關(guān)于網(wǎng)絡(luò)時(shí)延性能的研究很少。文獻(xiàn)[6-7]分別對(duì)流星余跡通信中Ⅰ型HARQ和Ⅱ型HARQ的性能進(jìn)行了仿真研究,并從吞吐量、重傳率、重傳次數(shù)、信道利用率等方面進(jìn)行了對(duì)比分析,但沒(méi)有涉及兩種機(jī)制下的網(wǎng)絡(luò)時(shí)延性能。文獻(xiàn)[8]研究了基本ARQ技術(shù)的時(shí)延性能,并進(jìn)行了建模仿真,但研究結(jié)果未必適應(yīng)HARQ機(jī)制的特點(diǎn),而且沒(méi)有在流星余跡通信的背景下進(jìn)行研究,缺乏適用性。

本文結(jié)合流星余跡通信系統(tǒng)的網(wǎng)絡(luò)結(jié)構(gòu)以及HARQ傳輸機(jī)制的特點(diǎn),提出了流星余跡通信中HARQ機(jī)制的網(wǎng)絡(luò)時(shí)延模型,立足于單條鏈路上的數(shù)據(jù)傳輸過(guò)程,利用排隊(duì)論的相關(guān)理論,建立了基于Ⅰ型HARQ的傳輸時(shí)延估算模型,并引入Ⅱ型HARQ的改進(jìn)機(jī)制,進(jìn)而提出了基于Ⅱ型HARQ的傳輸時(shí)延估算模型,最后通過(guò)仿真對(duì)兩種HARQ的傳輸時(shí)延性能進(jìn)行了對(duì)比分析。

1 流星余跡通信系統(tǒng)

1.1 流星余跡通信系統(tǒng)的網(wǎng)絡(luò)模型

一個(gè)最基本的流星余跡通信結(jié)構(gòu)由一個(gè)主站和一個(gè)從站組成,流星余跡通信網(wǎng)絡(luò)可由許多這樣點(diǎn)到點(diǎn)的通信結(jié)構(gòu)組成。主從站之間通信通常采用半雙工工作方式,而主站之間通信采用全雙工工作方式。根據(jù)國(guó)內(nèi)外研究現(xiàn)狀,流星余跡通信系統(tǒng)的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)一般包括:?jiǎn)沃髡拘切屯負(fù)浣Y(jié)構(gòu)、多主站環(huán)型拓?fù)浣Y(jié)構(gòu)、樹(shù)形拓?fù)浣Y(jié)構(gòu)和混合型拓?fù)浣Y(jié)構(gòu)[9]。

單主站星型拓?fù)浣Y(jié)構(gòu)是流星余跡通信系統(tǒng)最常見(jiàn)的網(wǎng)絡(luò)結(jié)構(gòu),由一個(gè)中心節(jié)點(diǎn)和多個(gè)子節(jié)點(diǎn)構(gòu)成,中心節(jié)點(diǎn)是整個(gè)網(wǎng)路的核心,子節(jié)點(diǎn)只能與中心節(jié)點(diǎn)通信。多主站環(huán)型拓?fù)浣Y(jié)構(gòu)中,主站以環(huán)形結(jié)構(gòu)相聯(lián),各主站以星型結(jié)構(gòu)與若干從站相聯(lián),主站節(jié)點(diǎn)通過(guò)點(diǎn)到點(diǎn)的鏈路首尾相聯(lián)形成一個(gè)閉合的環(huán),子節(jié)點(diǎn)之間的信息傳遞必須先經(jīng)過(guò)環(huán)形結(jié)構(gòu)。樹(shù)型拓?fù)浣Y(jié)構(gòu)是一種層次結(jié)構(gòu),通常由一個(gè)控制級(jí)聯(lián)多個(gè)主站構(gòu)成主干網(wǎng),節(jié)點(diǎn)按層次聯(lián)接,信息交換主要在上下節(jié)點(diǎn)之間進(jìn)行,相鄰節(jié)點(diǎn)或同層節(jié)點(diǎn)之間一般不進(jìn)行數(shù)據(jù)交換。混合型拓?fù)浣Y(jié)構(gòu)則是兩種或兩種以上的拓?fù)浣Y(jié)構(gòu)同時(shí)使用。

綜合考慮各種流星余跡網(wǎng)絡(luò)拓?fù)?、通信方式的?yōu)缺點(diǎn),同時(shí)結(jié)合項(xiàng)目要求,本文所涉及的流星余跡通信系統(tǒng)網(wǎng)絡(luò)模型設(shè)計(jì)如圖1所示。

本網(wǎng)絡(luò)結(jié)構(gòu)模型由4個(gè)星型網(wǎng)絡(luò)相互聯(lián)接構(gòu)成,每個(gè)星型網(wǎng)絡(luò)由1個(gè)主站和4個(gè)從站組成,主站與從站可以直接通信,從站之間不能直接通信,必須通過(guò)主站實(shí)現(xiàn)與其他從站之間的通信。主站與從站之間的通信方式為無(wú)線通信,通信信道采用流星余跡信道,主站之間的通信方式為有線通信。各星型網(wǎng)通過(guò)主站之間的互聯(lián)實(shí)現(xiàn)網(wǎng)間通信。

1.2 流星余跡通信網(wǎng)絡(luò)的差錯(cuò)控制要求

首先簡(jiǎn)要介紹一下流星余跡信道的典型特征。流星余跡信道依賴于流星的突發(fā)性而產(chǎn)生,具有明顯的間斷性和瞬時(shí)性[1]。以欠密類流星余跡為例,其發(fā)生過(guò)程時(shí)間極短,通常在幾百毫秒到1秒之間; 且信道信道時(shí)變性強(qiáng),變化規(guī)律呈指數(shù)衰減特征,如圖2所示[10]。

考慮到流星余跡信道的這些特點(diǎn),為了保證數(shù)據(jù)的可靠傳輸,提高系統(tǒng)傳輸效率,流星余跡通信中的差錯(cuò)控制協(xié)議應(yīng)當(dāng)適合突發(fā)、非對(duì)稱的信道特征,且綜合考慮糾錯(cuò)與重傳的收益,同時(shí)還應(yīng)適當(dāng)引入變速率技術(shù)[1]。近年來(lái),將FEC與ARQ結(jié)合起來(lái)的HARQ差錯(cuò)控制協(xié)議由于對(duì)流星余跡信道具有很強(qiáng)的適用性,被廣泛應(yīng)用于流星余跡通信系統(tǒng)中。

2 HARQ傳輸機(jī)制和時(shí)延模型

HARQ傳輸機(jī)制的基本思想是,將ARQ和FEC有效結(jié)合起來(lái),即在傳統(tǒng)ARQ系統(tǒng)中嵌入一個(gè)FEC子系統(tǒng),就得到了HARQ傳輸系統(tǒng)。它采用的碼同時(shí)具備糾錯(cuò)功能和檢錯(cuò)功能,其中FEC子系統(tǒng)利用糾錯(cuò)碼來(lái)糾正經(jīng)常出現(xiàn)的錯(cuò)誤,而ARQ系統(tǒng)只在檢測(cè)出少數(shù)不可糾的錯(cuò)誤時(shí)才請(qǐng)求重傳,這樣既減少了重傳次數(shù),也確保了信息的可靠傳輸。實(shí)際應(yīng)用表明,HARQ系統(tǒng)的可靠性比FEC系統(tǒng)強(qiáng),傳輸效率也比ARQ系統(tǒng)高[11]。HARQ的系統(tǒng)原理如圖3。

2.1 Ⅰ型HARQ傳輸機(jī)制

流星突發(fā)通信中的Ⅰ型HARQ的基本原理如下:發(fā)送端在探測(cè)后,向接收端發(fā)送一個(gè)能糾錯(cuò)同時(shí)能檢錯(cuò)的碼字序列,接收端接收到碼組后首先進(jìn)行檢錯(cuò): 如果檢測(cè)沒(méi)有錯(cuò)誤則向發(fā)送端反饋確認(rèn)(ACKnowledgement,ACK)信號(hào),碼組傳輸成功;如果檢測(cè)到一個(gè)或多個(gè)錯(cuò)誤,接收端嘗試確定錯(cuò)誤位置并進(jìn)行糾錯(cuò),若錯(cuò)誤在可糾正的范圍內(nèi),則通過(guò)譯碼器自動(dòng)糾正后將碼組呈送上層,若無(wú)法糾錯(cuò)(即譯碼失?。?,則接收端向發(fā)送端反饋非確認(rèn)(Negative ACKnowledgment,NACK)信號(hào)并將碼組丟棄,發(fā)送端收到NACK后重新發(fā)送與第一次格式相同的碼組,接收端重復(fù)上述操作,直到接收端正確接收碼組為止。其工作原理如圖4[12]。

2.2 Ⅱ型HARQ傳輸機(jī)制

Ⅱ型HARQ機(jī)制的基本原理如下:通常采用將信息部分和校驗(yàn)部分分開(kāi)傳送的方式,發(fā)送端先將攜帶信息部分的碼組傳送給接收端,接收端對(duì)接收到的碼組進(jìn)行檢錯(cuò): 如果檢測(cè)沒(méi)有錯(cuò)誤則向發(fā)送端反饋ACK信號(hào),碼組傳輸成功;如果檢測(cè)出錯(cuò),則向發(fā)送端反饋NACK信號(hào),發(fā)送端收到NACK信號(hào)后,將攜帶校驗(yàn)部分的碼組傳送給接收端,接收端將校驗(yàn)部分與之前收到的信息部分結(jié)合起來(lái),并對(duì)新的碼組進(jìn)行檢錯(cuò)糾錯(cuò)。如果碼組沒(méi)有錯(cuò)誤或錯(cuò)誤在可糾正范圍內(nèi),則將正確碼組呈送上層;如果碼組出錯(cuò)難以糾正,則向發(fā)送端反饋NACK信號(hào)。發(fā)送端第二次收到NACK信號(hào)以后,每次重傳逐漸增加校驗(yàn)信息,從而使接收端合成的碼組糾錯(cuò)能力不斷增強(qiáng),接收端則重復(fù)上述操作,直到正確接收碼組為止。其工作原理如圖5。

3.2 引入改進(jìn)機(jī)制的Ⅱ型HARQ傳輸時(shí)延估算模型

Ⅱ型HARQ機(jī)制相對(duì)于Ⅰ型HARQ機(jī)制主要有兩方面的改進(jìn)[16]:一是采用了自適應(yīng)變速率思想,二是增加了冗余機(jī)制。因此,3.1節(jié)所描述的延時(shí)估算模型不能完全適用于Ⅱ型HARQ機(jī)制。針對(duì)于此,本文在3.1節(jié)模型的基礎(chǔ)上進(jìn)行以下改進(jìn)。

首先討論自適應(yīng)變速率方法對(duì)模型的影響。流星余跡通信中常用的自適應(yīng)變速率方法主要有兩種:一種是自適應(yīng)編碼,根據(jù)信道特性自適應(yīng)地改變糾錯(cuò)編碼的速率,即通過(guò)改變前向糾錯(cuò)碼的冗余度改變信息的傳輸速率,一般保持調(diào)制方式和碼元速率不變;另一種是自適應(yīng)調(diào)制,保持碼元傳輸速率不變而改變調(diào)制方式,即通過(guò)改變碼元中的比特?cái)?shù)目來(lái)改變信息的傳輸速率。以上兩種方法中,碼元傳輸速率均保持不變,在模型中的表現(xiàn)為:分組一次正確傳輸時(shí)間tl和分組重傳時(shí)間tn保持不變,這一點(diǎn)與3.1節(jié)模型相同。由此可知,若分組重傳n次,則等效服務(wù)時(shí)延仍與3.1節(jié)模型中相同,可參考式(3)。

4 仿真與分析

為了驗(yàn)證流星余跡通信中HARQ的時(shí)延性能,本文在C++仿真環(huán)境下分別對(duì)不同分組正確傳輸概率和分組時(shí)間長(zhǎng)度下的兩種HARQ機(jī)制延時(shí)性能進(jìn)行了仿真,并作了對(duì)比分析。

4.1 仿真場(chǎng)景設(shè)置

仿真場(chǎng)景設(shè)置為流星余跡通信網(wǎng)絡(luò)中主站到從站通信過(guò)程,鏈路采用欠密類流星余跡信道,余跡持續(xù)時(shí)間1s,信道中的噪聲類型采用高斯白噪聲,Ⅰ型HARQ采用固定速率,Ⅱ型HARQ自適應(yīng)方式采用三檔變速率,調(diào)制方式分別采用BPSK、4QAM和16QAM,依據(jù)文獻(xiàn)[1],上述仿真場(chǎng)景對(duì)應(yīng)的主要實(shí)驗(yàn)參數(shù)設(shè)置如表1。

4.2 仿真結(jié)果分析

通過(guò)仿真分別得到了兩種HARQ傳輸時(shí)延隨分組傳輸正確率和分組時(shí)間長(zhǎng)度的變化規(guī)律,如圖6和圖7所示。

圖6比較了Ⅰ型HARQ和Ⅱ型HARQ在不同分組傳輸正確率下的傳輸時(shí)延。從圖6中可以看出,隨著分組傳輸正確率的提高,Ⅰ型HARQ和Ⅱ型HARQ的傳輸時(shí)延均呈現(xiàn)下降的趨勢(shì)。Ⅱ型HARQ的整體時(shí)延均比相同條件下Ⅰ型HARQ的小,當(dāng)分組傳輸正確率較小時(shí),Ⅱ型HARQ的傳輸時(shí)延比Ⅰ型HARQ小得多,隨著分組傳輸正確率的不斷提高,兩者差距才逐漸縮小。這是因?yàn)棰蛐虷ARQ的冗余機(jī)制能使傳輸碼組的糾錯(cuò)能力不斷增強(qiáng),在鏈路條件不好的條件下仍能保持較高的傳輸效率,說(shuō)明在分組傳輸正確率較低的情況下,Ⅱ型HARQ的優(yōu)勢(shì)比Ⅰ型HARQ更突出。

圖7通過(guò)改變分組時(shí)間長(zhǎng)度,得到Ⅰ型HARQ和Ⅱ型HARQ傳輸時(shí)延的比較結(jié)果。兩種傳輸機(jī)制的時(shí)延均與分組時(shí)間長(zhǎng)度呈正相關(guān)。在分組時(shí)間長(zhǎng)度較小時(shí),Ⅱ型HARQ的強(qiáng)糾錯(cuò)能力不能得以體現(xiàn),兩者的分組傳輸時(shí)延相差不大。隨著分組時(shí)間長(zhǎng)度的增加,由于Ⅱ型HARQ能有效提高傳輸正確率,從而提高傳輸效率,其傳輸時(shí)延比Ⅰ型HARQ有了很大改善。

通過(guò)分析可知,在流星余跡通信中,Ⅱ型HARQ的傳輸時(shí)延性能比Ⅰ型HARQ有明顯優(yōu)勢(shì),Ⅱ型HARQ對(duì)流星余跡通信系統(tǒng)具有更好的適用性。

5 結(jié)語(yǔ)

本文以流星余跡通信為背景,針對(duì)HARQ傳輸機(jī)制下的網(wǎng)絡(luò)時(shí)延性能,主要做了以下幾個(gè)方面的工作:

1)結(jié)合流星余跡通信系統(tǒng)的特點(diǎn),分析了HARQ傳輸機(jī)制的工作原理,并建立了網(wǎng)絡(luò)時(shí)延的構(gòu)成模型。

2)從排隊(duì)論的角度出發(fā),提出了流星余跡通信中Ⅰ型HARQ的傳輸時(shí)延估算模型。模型充分考慮了流星余跡通信的特殊性和HARQ傳輸機(jī)制的特點(diǎn),對(duì)流星余跡通信理論的研究具有一定的參考價(jià)值。

3)以Ⅰ型HARQ傳輸時(shí)延估算模型為基礎(chǔ),引入自適應(yīng)傳輸與冗余機(jī)制的優(yōu)化特征,改進(jìn)建立了Ⅱ型HARQ的傳輸時(shí)延估算模型。

4)對(duì)兩種HARQ的傳輸時(shí)延性能進(jìn)行了仿真,對(duì)比分析了Ⅰ型HARQ和Ⅱ型HARQ的傳輸時(shí)延隨不同參數(shù)的變化規(guī)律。仿真結(jié)果表明,在流星余跡通信系統(tǒng)中,Ⅱ型HARQ的時(shí)延性能優(yōu)于Ⅰ型HARQ。

下一步的工作將是把本文的結(jié)論應(yīng)用于更復(fù)雜的流星余跡通信網(wǎng)絡(luò)中,提出更有效的延時(shí)估算方法。

參考文獻(xiàn):

[1] 李贊,劉增基,沈健.流星余跡通信理論與應(yīng)用[M].北京:電子工業(yè)出版社,2011:24-28.(LI Z, LIU Z J, SHEN J. Theory and Application of Meteor Burst Communication[M]. Beijing: Publishing House of Electronics Industry, 2011: 24-28.)

[2] 何先剛,夏萬(wàn)林,聶永萍,等.OFDM系統(tǒng)中的混合ARQ結(jié)構(gòu)及性能仿真[J]. 重慶大學(xué)學(xué)報(bào)(自然科學(xué)版),2003,26(8):56-59.(HE X G, XIA W L, NIE Y P, et al. Hybrid ARQ structure and performance simulation for OFDM systems[J]. Journal of Chongqing University (Natural Science Edition), 2003, 26(8): 56-59.)

[3] 李旭虹,劉燕,王安義.LTE系統(tǒng)下行鏈路中HARQ技術(shù)的研究與仿真[J].工礦自動(dòng)化,2012,38(1):62-65.(LI X H, LIU Y, WANG A Y. Research of HARQ technology in LTE system downlink and its simulation[J]. Industry and Mine Automation, 2012, 38(1): 62-65.)

[4] 馬志強(qiáng),王建剛,鄭振華.流星突發(fā)通信中的混合ARQ技術(shù)研究[J].通信技術(shù),2011,44(10):4-6.(MA Z Q, WANG J G, ZHENG Z H. Research on hybrid ARQ technology in meteor burst communication[J]. Communication Technology, 2011, 44(10): 4-6.)

[5] MICHAEL B P, STUART D S. Variable-rate hybrid ARQ for meteor-burst communications[J]. IEEE Transactions on Communications, 1992, 40(1):60-73.

[6] 石會(huì)芳.流星余跡通信系統(tǒng)自適應(yīng)鏈路傳輸技術(shù)研究[D].西安:西安電子科技大學(xué),2013: 43-63.(SHI H F. Research on the technology of adaptive link in meteor burst communication system[D]. Xian: Xidian University, 2013: 43-63.)

[7] 吳妍.流星突發(fā)通信中基于位圖反饋的HARQⅡ型鏈路傳輸協(xié)議研究[D].西安:西安電子科技大學(xué),2014: 33-50.(WU Y. Research on the HARQⅡ link transmission protocol based on bitmap feedback in meteor burst communication system[D]. Xian: Xidian University,2014: 33-50.)

[8] 黎鎖平,劉存明,何志鵬.無(wú)線數(shù)據(jù)傳輸?shù)腉BN-ARQ和SR-ARQ系統(tǒng)時(shí)延性能研究[J].信號(hào)處理,2009,25(3):384-388.(LI S P, LIU C M, HE Z P. Research on the delay performance of GBN-ARQ and SR-ARQ systems in wireless data transmission[J]. Signal Processing, 2009, 25(3):384-388.)

[9] 商英俊.流星余跡信道特征與組網(wǎng)技術(shù)仿真研究[D].西安:西安電子科技大學(xué),2009: 5-8.(SHANG Y J. Simulation studies of meteor burst channel characteristics and networking technology[D]. Xian: Xidian University, 2009: 5-8.)

[10] 張金平,韓娟娟,金力軍.流星余跡通信信道建模與性能仿真[J].無(wú)線電通信技術(shù),2002,28(5):41-44.(ZHANG J P, HAN J J, JIN L J. Modeling and performance simulation of meteor burst communication channel[J]. Radio Communications Technology, 2002;28(5):41-44.)

[11] 李允利.流星余跡通信系統(tǒng)鏈路傳輸技術(shù)研究[D].西安:西安電子科技大學(xué),2009: 33-48.(LI Y L. Research on link transmission technology in meteor burst communication[D]. Xian: Xidian University, 2009: 33-48.)

[12] 盧世軍.時(shí)變信道中自適應(yīng)多狀態(tài)ARQ系統(tǒng)時(shí)延性能建模研究[D].蘭州:蘭州理工大學(xué),2009: 27-29.(LU S J. Delay performance analysis of the adaptive multi-state automatic repeat request system model in time-varying channel[D]. Lanzhou: Lanzhou University of Technology,2009: 27-29.)

[13] 唐應(yīng)輝,唐小我.排隊(duì)論――基礎(chǔ)與分析技術(shù)[M].北京:科學(xué)出版社,2006:137-142.(TANG Y H, TANG X W. Queuing Theory-Foundation and Analysis Technology[M]. Beijing: Science Press, 2006:137-142.)

[14] 周曉波,周健,盧漢成,等.DTN網(wǎng)絡(luò)的延時(shí)模型分析[J].計(jì)算機(jī)研究與發(fā)展,2008,46(5):960-966.(ZHOU X B, ZHOU J, LU H C, et al. Analysis of delay model in DTN[J]. Journal of Computer Research and Development, 2008, 46(5): 960-966.)

篇4

關(guān)鍵詞:大數(shù)據(jù) 網(wǎng)絡(luò)輿情 數(shù)據(jù)抓取 數(shù)據(jù)存儲(chǔ) 輿情分析

中圖分類號(hào):G206 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2017)01(c)-0108-02

S著新興媒體的發(fā)展,互聯(lián)網(wǎng)輿情已經(jīng)在社會(huì)發(fā)展中扮演著重要的角色,它已不僅僅局限于個(gè)別范圍的使用和拓展,而是演變?yōu)槿窕?dòng)型的參與和討論,所以如何在眾多信息中獲取最全面的輿情數(shù)據(jù),并將輿情數(shù)據(jù)以最快的速度和最靈活的方式展現(xiàn)出來(lái),使輿情在可控的范圍內(nèi)實(shí)現(xiàn)最大的社會(huì)和商業(yè)價(jià)值,顯得尤為重要。

1 網(wǎng)絡(luò)輿情

網(wǎng)絡(luò)輿情不同于傳統(tǒng)輿情,傳統(tǒng)輿情是民意理論中的一個(gè)概念,是民意的一種綜合反映。該文所提到的網(wǎng)絡(luò)輿情,是未經(jīng)任何中介包裝和驗(yàn)證,直接于網(wǎng)上的社會(huì)輿情,并以互聯(lián)網(wǎng)為載體,以輿論事件為核心,集民眾情感、態(tài)度、意見(jiàn)、建議、傳播互動(dòng)和影響力于一身的集合。

因?yàn)榫W(wǎng)絡(luò)輿情的傳播介質(zhì)是網(wǎng)絡(luò),網(wǎng)絡(luò)既具有公開(kāi)性又具有隱蔽性,同時(shí)需要事件、網(wǎng)民、網(wǎng)民情感,以及通過(guò)網(wǎng)絡(luò)介質(zhì)的傳播和互動(dòng),所以在既公開(kāi)又隱蔽的環(huán)境中,從眾多的信息中捕獲并抽取出復(fù)雜的網(wǎng)民情緒和態(tài)度非常重要。

2 輿情捕獲

由于輿情具有自由性、交互性、多元性、偏差性和突發(fā)性,所以如何從眾多輿情中獲取實(shí)時(shí)數(shù)據(jù)并服務(wù)于大眾,是新興媒體所面臨的嚴(yán)峻挑戰(zhàn)和考驗(yàn)。

2.1 關(guān)鍵詞確定

在互聯(lián)網(wǎng)上傳播的信息可以用海量來(lái)形容,如果針對(duì)輿情盲目進(jìn)行檢索,猶如大海撈針,不僅得不到我們想要的數(shù)據(jù),還會(huì)浪費(fèi)大量的人力、物力和財(cái)力來(lái)投入到數(shù)據(jù)的分析中。所以如何在海量的信息中獲取用戶想要的數(shù)據(jù),“關(guān)鍵詞”就顯得非常重要,它不僅可以讓我們精確地捕獲到想要的數(shù)據(jù),而且還可以減少臟數(shù)據(jù)的捕獲,大大縮短了輿情分析的時(shí)間,提升了輿情分析的反應(yīng)速率,下面就介紹幾種關(guān)鍵詞確定的方法。

(1)定制關(guān)鍵詞。關(guān)鍵詞的確定可以從輿情分析的發(fā)出者來(lái)反向提出,輿情分析的發(fā)出者一定是希望從網(wǎng)絡(luò)輿情中得到某種相關(guān)信息,那么我們可以從需求提出者和需求分析者的角度來(lái)確定關(guān)鍵詞,即關(guān)鍵詞由用戶提出,并通過(guò)需求分析將用戶的表述發(fā)展為定制詞語(yǔ),并將其定義為用戶定制關(guān)鍵詞。根據(jù)用戶定制的關(guān)鍵詞來(lái)捕獲數(shù)據(jù),是最直接明了的數(shù)據(jù)捕獲方式。

(2)熱門輿情關(guān)鍵詞。很多網(wǎng)站如百度、搜狐、Facebook、新浪等幾乎所有的交互網(wǎng)站都會(huì)有熱門指數(shù),我們可以借助這些網(wǎng)站自身攜帶的熱門指數(shù),來(lái)確定關(guān)鍵詞。因?yàn)橥ㄟ^(guò)熱門輿情關(guān)鍵詞來(lái)捕獲數(shù)據(jù),一定是網(wǎng)站熱門數(shù)據(jù),這樣不僅可以節(jié)省我們分析確定關(guān)鍵詞的時(shí)間,而且還可以用最短的時(shí)間獲取最多的分析數(shù)據(jù),提高大數(shù)據(jù)在輿情分析中的反應(yīng)速率。

(3)熱搜輿情關(guān)鍵詞。熱搜輿情關(guān)鍵詞不同于熱門關(guān)鍵詞,由于輿情具有廣泛傳播性,很多人參與到輿情探討中,都是通過(guò)網(wǎng)絡(luò)搜索并定位的,所以熱搜關(guān)鍵詞就是根據(jù)搜索引擎的熱搜排行榜,來(lái)確定輿情關(guān)鍵詞,通過(guò)熱搜排行榜,我們可以第一時(shí)間知道并了解網(wǎng)民想要了解的輿論事件。

(4)參考輿情網(wǎng)站。想要找到網(wǎng)絡(luò)事件的發(fā)展?fàn)顩r和原由,最簡(jiǎn)單也是最直接的方式,就是找到輿情的網(wǎng)站,很多網(wǎng)站就是網(wǎng)絡(luò)輿情事件的源泉。

2.2 數(shù)據(jù)抓取

當(dāng)我們通過(guò)各種方式獲取并確定了關(guān)鍵詞之后,如何把關(guān)鍵詞變成我們想要的精確數(shù)據(jù),就顯得非常重要。我們可以通過(guò)網(wǎng)絡(luò)爬蟲(chóng)技術(shù)來(lái)獲取輿情數(shù)據(jù)。

當(dāng)前主流的數(shù)據(jù)抓取模式主要包含4個(gè)主要部分:網(wǎng)絡(luò)爬蟲(chóng)技術(shù)(Spider)、數(shù)據(jù)處理技術(shù)(Data Process)、爬取URL隊(duì)列(URL Queue)和數(shù)據(jù)。爬蟲(chóng)主要是從互聯(lián)網(wǎng)上捕捉網(wǎng)頁(yè)內(nèi)容,并從中抽取出需要的內(nèi)容。數(shù)據(jù)處理:對(duì)爬蟲(chóng)抓取的內(nèi)容進(jìn)行處理。URL隊(duì)列:為爬蟲(chóng)提供需要抓取數(shù)據(jù)網(wǎng)站的URL。數(shù)據(jù)包含3個(gè)方面:(1)Site URL:需要抓取數(shù)據(jù)網(wǎng)站的URL信息;(2)Spider Data:爬蟲(chóng)從網(wǎng)頁(yè)中抽取出來(lái)的數(shù)據(jù);(3)Dp Data:經(jīng)過(guò)dp處理之后的數(shù)據(jù)。

2.3 數(shù)據(jù)存儲(chǔ)

因?yàn)榫W(wǎng)絡(luò)輿情具有及時(shí)更新和海量的特性,所以我們?nèi)绾螌⒆ト〉降臄?shù)據(jù)實(shí)時(shí)保存起來(lái),是非常關(guān)鍵的,它決定了最后輿情分析的全面性和精確性。一般通過(guò)IT技術(shù)可以將數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫(kù)中,下面介紹一下當(dāng)前主流的3種數(shù)據(jù)庫(kù)及其區(qū)別。

Oracle數(shù)據(jù)文件都是采用二進(jìn)制編碼的文件,而且它可以對(duì)SQL在執(zhí)行過(guò)程中的解析和優(yōu)化指定統(tǒng)一標(biāo)準(zhǔn),其中包括RBO、CBO以及HTNT規(guī)則,這些都會(huì)使在Oracle數(shù)據(jù)庫(kù)中執(zhí)行的SQL擁有極大的優(yōu)化自由,同時(shí)也對(duì)CPU、內(nèi)存、IO資源方面進(jìn)行優(yōu)化。

MySQL最大的特點(diǎn)應(yīng)該屬自由選擇存儲(chǔ)引擎。它的每一個(gè)表都是一個(gè)文件,都可以選擇合適的存儲(chǔ)引擎。但由于它的存儲(chǔ)引擎是開(kāi)放式的插件引擎,所以文件的一致性大大降低,并且在SQL優(yōu)化方面,也會(huì)有一些不可避免的瓶頸,例如多表關(guān)聯(lián)、子查詢優(yōu)化、統(tǒng)計(jì)函數(shù)等都是它的弱項(xiàng),并且MySQL只支持極簡(jiǎn)單的HINT。

SQL Server的數(shù)據(jù)架構(gòu)基本是縱向劃分,分為:Protocol Layer、Relational Engine、Storage Engine、SQLOS。SQL執(zhí)行都是逐層,其中Relational Engine中的優(yōu)化器,是基于成本的,其工作過(guò)程跟Oracle是非常相似的。同時(shí)它也支持豐富的HINT,包括:連接提示、查詢提示、表提示。

雖然,這3個(gè)數(shù)據(jù)庫(kù)各具特色,但是,如果對(duì)數(shù)據(jù)安全、存儲(chǔ)等特性沒(méi)有特殊要求,通常我們會(huì)選取MySQL數(shù)據(jù)庫(kù),因?yàn)殚_(kāi)源而且操作相對(duì)簡(jiǎn)單。

3 輿情分析

如果說(shuō)輿情數(shù)據(jù)的抓取和存儲(chǔ)目的是在數(shù)據(jù)獲取方面下工夫,那么輿情分析就是通過(guò)比較、論證等方法把數(shù)據(jù)通過(guò)圖形報(bào)表等更加簡(jiǎn)潔的方式呈獻(xiàn)給用戶。

每一個(gè)輿情事件的本身都有自己的特點(diǎn),分析設(shè)計(jì)人員可以根據(jù)不同的特點(diǎn)選擇輿情分析的方法或報(bào)表。通常輿情分析方法有連續(xù)接近法、舉例說(shuō)明法、比較分析法和流程圖法等。通常圖形報(bào)表也有很多種,如趨勢(shì)圖、比例餅圖、百分比柱圖、流程圖、表格等,分析設(shè)計(jì)人員根據(jù)輿情的特點(diǎn)選擇合適的圖形呈獻(xiàn)給用戶。

4 結(jié)語(yǔ)

通過(guò)大數(shù)據(jù)相關(guān)技術(shù)對(duì)輿情進(jìn)行全方位收集、存儲(chǔ)和分析的過(guò)程中,我們既不修飾、篡改輿情事件的真實(shí)性,也不隱藏輿情事件的丑陋性,大數(shù)據(jù)的智能捕獲分析,只是將網(wǎng)絡(luò)輿情更加清晰形象地呈現(xiàn)給用戶,使用戶在第一時(shí)間獲取民眾態(tài)度,掌握民眾意見(jiàn)或建議,并根據(jù)輿情報(bào)告的精準(zhǔn)分析反饋,及時(shí)對(duì)輿情事件做出相應(yīng)的政策,調(diào)整相關(guān)的策略,實(shí)現(xiàn)商業(yè)和政治利益最大化,創(chuàng)造更多的社會(huì)價(jià)值,并使網(wǎng)絡(luò)輿情健康良性發(fā)展。

參考文獻(xiàn)

[1] 王博.大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)輿情與社會(huì)治理研究[D].云南財(cái)經(jīng)大學(xué),2016.

[2] 楊旭東.網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)關(guān)鍵技術(shù)研究[J].信息網(wǎng)絡(luò)安全,2016(9):251-256.

篇5

他是一位網(wǎng)絡(luò)輿情分析師,輿情分析師作為一種新職業(yè),近期被《人民日?qǐng)?bào)》撰文評(píng)為“朝陽(yáng)職業(yè)”,從業(yè)者大多不敢自言資深或?qū)<?,而許多人恐怕還不知曉輿情分析是何物。

網(wǎng)絡(luò)上的情報(bào)收集者?

關(guān)于網(wǎng)絡(luò)輿情,比較權(quán)威的解釋是:“通過(guò)互聯(lián)網(wǎng)傳播的人們對(duì)于各種事件的所有認(rèn)知、態(tài)度、情感和行為傾向的集合?!迸c“輿論”一詞不同,輿情是網(wǎng)絡(luò)上媒體和網(wǎng)民意見(jiàn)的原始表露,可以是多種不同意見(jiàn)的簡(jiǎn)單集合,而輿論則是傾向于一致的看法和意見(jiàn)。

輿情可能轉(zhuǎn)化為輿論,自然而然地,網(wǎng)絡(luò)輿情分析師的重要工作即分析輿情、預(yù)測(cè)走勢(shì),在一定程度上防止負(fù)面輿論的產(chǎn)生。

對(duì)趙嘉和同事們來(lái)說(shuō),上網(wǎng)閱讀新聞便是他們每天工作的開(kāi)端。他們幾乎對(duì)網(wǎng)上所有熱點(diǎn)事件都有所了解,同時(shí)每個(gè)人又要著重關(guān)注一兩個(gè)領(lǐng)域,成為半個(gè)行家。例如學(xué)法語(yǔ)出身的趙嘉就曾硬著頭皮研究了經(jīng)濟(jì)學(xué)知識(shí),因?yàn)樗?wù)的客戶是貿(mào)易部門,在能夠基本完成該行業(yè)輿情報(bào)告的撰寫之后,他又“被迫轉(zhuǎn)行”學(xué)習(xí)了科技知識(shí)。

許多媒體對(duì)這個(gè)行業(yè)的介紹中都有這樣的描述――專多能的“雜家”。

輿情分析師聽(tīng)起來(lái)有點(diǎn)像收集情報(bào)者,似乎也能和公關(guān)扯上些許關(guān)系。為什么一定要冠以“網(wǎng)絡(luò)”二字?

根據(jù)中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心的最新報(bào)告顯示,截至20lO年12月底,我國(guó)網(wǎng)民規(guī)模突破達(dá)到4.57億,互聯(lián)網(wǎng)普及率攀升至34.3%。在大城市中,主流人群基本上都已經(jīng)是“網(wǎng)民”。龐大的用戶群體和網(wǎng)絡(luò)迅速的普及速度,使得網(wǎng)絡(luò)輿論在輿情系統(tǒng)中的地位不斷提升。

比較普遍的認(rèn)識(shí)是,國(guó)內(nèi)網(wǎng)絡(luò)輿情監(jiān)測(cè)與研究機(jī)構(gòu)出現(xiàn)于2008年,網(wǎng)格輿情分析師也隨之誕生――之前的2007年,山西爆發(fā)“黑磚窯”事件,網(wǎng)絡(luò)熱點(diǎn)的沸騰程度讓各方開(kāi)始重視網(wǎng)絡(luò)輿情。

如今,一條負(fù)面信息從出現(xiàn)到形成熱點(diǎn)的周期,已經(jīng)從原來(lái)的24小時(shí)縮短到了4小時(shí),相關(guān)部門如果不能快速做出反饋、制定應(yīng)對(duì)策略,就可能出現(xiàn)輿論一邊倒的局面。

輿情分析師的“網(wǎng)絡(luò)輿情”

按照分析師的工作思路,《世界博覽》記者在搜索引擎中輸入了“網(wǎng)絡(luò)輿情分析師”的關(guān)鍵詞,結(jié)果是:6月10日,百度找到相關(guān)結(jié)果約6.42萬(wàn)個(gè),谷歌找到約45.2萬(wàn)條結(jié)果。

在中國(guó),人民網(wǎng)輿情監(jiān)測(cè)室、新華網(wǎng)、外文局、國(guó)際廣播電臺(tái)、《中國(guó)日?qǐng)?bào)》等均提供較為專業(yè)的輿情服務(wù),而在國(guó)外,“Buzzlogic”、“尼爾森(Nielsen)”、“ReputationDefender”等輿情監(jiān)控機(jī)構(gòu)早已名聲鵲起。

一些經(jīng)濟(jì)刊物將“輿情分析”描述為“擁有百萬(wàn)億潛在市場(chǎng)的大生意”;許多知名大學(xué),例如人民大學(xué)成立了專門的研究院;越來(lái)越“智能”的搜索引擎還提供了從事輿情分析的專業(yè)公司和軟件的廣告,此類軟件系統(tǒng)已成為中國(guó)各大部委、省、市、縣等各級(jí)政府的重要采購(gòu)對(duì)象。

但這并不意味著網(wǎng)絡(luò)輿情分析師可以被軟件取代,相反,分析師在形成輿情報(bào)告過(guò)程中的作用愈發(fā)重要。本質(zhì)上,機(jī)器擔(dān)當(dāng)?shù)娜允禽o助角色。

趙嘉對(duì)《世界博覽》記者說(shuō),自己每天的工作確實(shí)會(huì)用到監(jiān)測(cè)軟件,但不能依賴,主要使用的工具是百度、谷歌、雅虎等搜索引擎,新聞則來(lái)自國(guó)內(nèi)外主流媒體和網(wǎng)站,如西方四大通訊社、各國(guó)主流媒體、新華社、《人民日?qǐng)?bào)》等,還有一些專門的數(shù)據(jù)庫(kù)搜索和站內(nèi)搜索,和他所在公司的客戶一樣,“屬于商業(yè)機(jī)密,無(wú)可奉告”。他們的客戶以國(guó)家機(jī)關(guān)為主,也有少量的企業(yè)和私人客戶。

輿情分析師通常需要通過(guò)搜索工具和監(jiān)測(cè)平臺(tái),反復(fù)設(shè)置不同的關(guān)鍵詞,收集媒體評(píng)論和網(wǎng)友言論,最終經(jīng)過(guò)選取、概括和分析形成完備的輿情報(bào)告。一些客戶還要求歸類和制作圖表。

趙嘉每天完成的輿情日?qǐng)?bào),長(zhǎng)度一般在八九頁(yè)左右,一些周報(bào)和月報(bào)以及重大事件的輿情會(huì)更復(fù)雜,因?yàn)檫@樣的報(bào)告是從上百甚至上千篇報(bào)道中提煉而成的。

趙嘉同事許欣的報(bào)告主要面向國(guó)家機(jī)關(guān):“有的部門經(jīng)常提出反饋,有的反饋則較少,但總體來(lái)看均屬比較重視。他們或是了解境內(nèi)外動(dòng)態(tài),或是預(yù)警,或是報(bào)送領(lǐng)導(dǎo)或上級(jí)。”

應(yīng)該說(shuō),客戶們?cè)絹?lái)越重視輿情報(bào)告,特別是曾在輿情方面“吃過(guò)虧”的客戶。近期,輿情關(guān)注度較高且應(yīng)對(duì)不力的應(yīng)屬故宮,相繼經(jīng)歷了“失竊門”、“錯(cuò)字門”、“會(huì)所門”、“解雇門”等負(fù)面事件,缺乏信息透明和公關(guān)技巧的故宮深陷輿論漩渦。

亟需人手的高負(fù)荷工作

和寫字樓里壓力頗高的白領(lǐng)們差不多,網(wǎng)絡(luò)輿情分析師也常常抱怨身體“亞健康”,鼠標(biāo)手、頸椎病、視力下降等職場(chǎng)常見(jiàn)病經(jīng)常會(huì)找上門來(lái)。

既然需要關(guān)注每天的新聞熱點(diǎn),所以,網(wǎng)絡(luò)輿情分析師在假期也難有“斷網(wǎng)”的日子,有時(shí)碰到一些項(xiàng)目,客戶規(guī)定要在短時(shí)間內(nèi)完成,經(jīng)常需要加班加點(diǎn)。

許欣對(duì)《世界博覽》記者說(shuō),她做過(guò)的最復(fù)雜的輿情報(bào)告匯編超出2000頁(yè),幾個(gè)人加班到很晚才完成?!白蠲Φ臅r(shí)候連喝水都忘了?!睂?duì)于每天要瀏覽的網(wǎng)頁(yè)數(shù)量,趙嘉和同事都算不過(guò)來(lái):“大概幾百頁(yè)吧?要想做得好必須不停更換關(guān)鍵詞,網(wǎng)頁(yè)也要盡可能多看?!?/p>

在人民網(wǎng)輿情監(jiān)測(cè)窒,“醉駕入刑”的輿情報(bào)告需要幾位輿情分析師研討協(xié)作,因?yàn)閮H新浪和騰訊微博上就有近18萬(wàn)條評(píng)論,需要多人監(jiān)測(cè)。該監(jiān)測(cè)室主任分析師龐胡瑞說(shuō):“輿情分析是腦力活,也是體力活,加班加點(diǎn)、每天瀏覽成百上千條網(wǎng)頁(yè)是家常便飯?!庇捎谳浨闃I(yè)務(wù)增長(zhǎng),這里一直在擴(kuò)大輿情分析師的編制。

雖然面對(duì)著繁重的任務(wù)和較高的壓力,分析師們也覺(jué)得,在不斷獲取、整理、推論信息的過(guò)程中,自己也收獲不小――“對(duì)新聞的敏感度和捕捉能力,對(duì)重點(diǎn)信息的宏觀把握和提取,邏輯思維和綜合分析的能力”。

篇6

關(guān)鍵詞:Web挖掘;文本分類;糧食輿情;輿情分析

中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2013)10-2426-03

糧食是人類生存之本,糧食安全問(wèn)題已經(jīng)成為世界范圍內(nèi)關(guān)注的最重要的問(wèn)題之一。糧食信息數(shù)據(jù)量大、市場(chǎng)供求信息不明確、技術(shù)保障不到位等因素對(duì)我國(guó)糧食安全敲響了警鐘。2009年初中國(guó)爆發(fā)了幾十年來(lái)最嚴(yán)重的一場(chǎng)旱災(zāi),國(guó)內(nèi)市場(chǎng)充斥著糧食供應(yīng)可能趨緊并有可能大量進(jìn)口糧油產(chǎn)品,以及全球糧油價(jià)格將由中國(guó)的大量進(jìn)口而出現(xiàn)暴漲等網(wǎng)絡(luò)言論并造成了一定的影響。

因此如何引入新的技術(shù)手段對(duì)糧食情報(bào)信息實(shí)現(xiàn)有效監(jiān)管,如何在海量的糧食網(wǎng)絡(luò)資源信息中,快速有效地挖掘蘊(yùn)含有巨大潛在價(jià)值的糧情知識(shí)和信息,同時(shí)過(guò)濾掉大量無(wú)用的或不相關(guān)的糧情內(nèi)容,準(zhǔn)確地定位所需要的信息并自動(dòng)分類,以保證糧食安全,已成為一項(xiàng)重要而迫切的研究課題。該文就基于Web挖掘在糧食情報(bào)分析中的應(yīng)用進(jìn)行了一些討論,并提出了一個(gè)基于Web挖掘的糧食輿情分析系統(tǒng)的框架。

1 糧食輿情系統(tǒng)模型設(shè)計(jì)

1.1 Web挖掘簡(jiǎn)介和糧食輿情分析難點(diǎn)

Web挖掘是從大量Web文檔集D中發(fā)現(xiàn)隱含的模式W。如果將D看作輸入,P看作輸出,則Web文本挖掘的過(guò)程可看作從輸入到輸出的映射,即F:CP。網(wǎng)絡(luò)輿情是公眾利用互聯(lián)網(wǎng)表達(dá)或傳播的對(duì)熱點(diǎn)事件和問(wèn)題的看法和所持觀點(diǎn)的較有社會(huì)影響力的態(tài)度。利用Web挖掘技術(shù)進(jìn)行主題追蹤的輿情分析成為近年研究的熱點(diǎn)。任海果研究了主題事件的追蹤技術(shù),實(shí)現(xiàn)了對(duì)熱點(diǎn)事件的發(fā)現(xiàn)、演化和趨勢(shì)分析[1]。Federico Neri等研究了1000個(gè)關(guān)于意大利公共廣播服務(wù)意見(jiàn)的Facebook網(wǎng)貼,得到了觀眾關(guān)注度和興趣度,并在開(kāi)源情報(bào)信息和Web挖掘中得到應(yīng)用[2]。Wang等利用垂直搜索技術(shù)收集互聯(lián)網(wǎng)上關(guān)于食品質(zhì)量和安全的網(wǎng)絡(luò)信息,搭建了食品安全的網(wǎng)絡(luò)輿情分析系統(tǒng),滿足了對(duì)食品安全網(wǎng)絡(luò)輿情的有效監(jiān)管[3]。但由于糧食信息的特殊性和復(fù)雜性[4],使得糧食輿情信息的采集不夠全面,現(xiàn)有分析系統(tǒng)的分析不夠深入,總體來(lái)說(shuō)糧食網(wǎng)絡(luò)輿情挖掘扔存在著一下難點(diǎn):

1) 糧食輿情影響因素復(fù)雜。糧食輿情受多種因數(shù)的影響,和糧食直接相關(guān)的有糧食產(chǎn)量、銷售價(jià)格、產(chǎn)地、供求關(guān)系等因數(shù),此外還有氣象條件、病蟲(chóng)害的等間接影響著糧食安全,目前對(duì)糧食安全因素的挖掘不夠全面。

2) 糧食輿情信息的存儲(chǔ)位置和方式復(fù)雜,沒(méi)有統(tǒng)一的系統(tǒng)來(lái)采集各種形式的糧食信息。如糧食產(chǎn)業(yè)信息資源,如災(zāi)害史、產(chǎn)量信息、氣象條件等,并發(fā)存儲(chǔ)在各家統(tǒng)計(jì)機(jī)構(gòu)、管理機(jī)構(gòu)、經(jīng)營(yíng)機(jī)構(gòu)的網(wǎng)絡(luò)環(huán)境中,并且沒(méi)有統(tǒng)一的數(shù)據(jù)表示形式,沒(méi)有開(kāi)發(fā)出聯(lián)合采集各家機(jī)構(gòu)和組織中糧食數(shù)據(jù)的采集或者存儲(chǔ)方法和策略,不利于糧食輿情信息的整合和關(guān)聯(lián)分析。

3) 糧食輿情信息牽涉面廣,沒(méi)有融合各方面信息處理方面的優(yōu)勢(shì)。在糧食信息處理方面,沒(méi)有實(shí)現(xiàn)統(tǒng)計(jì)學(xué)、模式識(shí)別、人工智能以及人工神經(jīng)網(wǎng)絡(luò)等多種分析方法融合的決策策略。

4) 沒(méi)有提出預(yù)測(cè)和預(yù)防模型?,F(xiàn)在的網(wǎng)絡(luò)輿情分析往往注重于熱點(diǎn)的發(fā)現(xiàn),沒(méi)有為熱點(diǎn)事件建立等級(jí)級(jí)別區(qū)分管理和提供預(yù)防,同時(shí)對(duì)于發(fā)現(xiàn)的災(zāi)難事件,沒(méi)有定量的分析災(zāi)害危害的嚴(yán)重程度和預(yù)警級(jí)別。

利于輿情分析技術(shù)實(shí)現(xiàn)對(duì)糧食輿情信息的監(jiān)控和管理成為一項(xiàng)緊迫的課題。為了解決以上問(wèn)題,該文設(shè)計(jì)了一個(gè)糧食輿情分析架構(gòu)模型。

1.2.2 輿情信息預(yù)處理模塊

輿情信息預(yù)處理模塊的主要功能是:對(duì)采集到的相關(guān)網(wǎng)頁(yè)進(jìn)行去噪處理,如對(duì)廣告、注釋等噪聲數(shù)據(jù)進(jìn)行清理,然后用統(tǒng)一的結(jié)構(gòu)化的格式進(jìn)行文本表示,然后利用分詞技術(shù)、特征提取技術(shù)、權(quán)重計(jì)算技術(shù)等進(jìn)行特征選擇,構(gòu)建糧食數(shù)據(jù)倉(cāng)庫(kù),利用分類器實(shí)現(xiàn)文本的分類。文本分類技術(shù)是整個(gè)預(yù)處理模塊的核心,其步驟描述如下:

本模型主要包括以下三個(gè)方面功能:

第一、通過(guò)對(duì)糧食輿情主題檢測(cè)進(jìn)行熱點(diǎn)、敏感信息的發(fā)現(xiàn),并針對(duì)特定的糧食安全主體,如糧食價(jià)格、供求關(guān)系、氣象條件等各個(gè)主題跟蹤技術(shù)處理,同時(shí)設(shè)計(jì)融合各方面因素的分析策略,及時(shí)發(fā)現(xiàn)安全隱患,并提供預(yù)警信息。

第二、對(duì)特定糧食安全事件的公眾所持觀點(diǎn)和關(guān)注度的分析,掌握事件發(fā)生、發(fā)展和加強(qiáng)的可視化時(shí)間序列,開(kāi)發(fā)基于區(qū)域性輿情的分別匯總,提供實(shí)時(shí)的空間和時(shí)間的網(wǎng)絡(luò)輿情趨勢(shì)信息保障,有利于決策者實(shí)施適當(dāng)?shù)拇胧?/p>

第三、利用災(zāi)害預(yù)測(cè)、分析和預(yù)防的決策系統(tǒng),對(duì)多發(fā)性的、危害嚴(yán)重的災(zāi)害構(gòu)建主動(dòng)分析、及早預(yù)測(cè)和及時(shí)預(yù)警的機(jī)制,提供相關(guān)、相近主題的預(yù)防措施經(jīng)驗(yàn)。同時(shí)針對(duì)災(zāi)害引起的其他方面的問(wèn)題進(jìn)行關(guān)聯(lián)分析,比如旱災(zāi)有可能引起局部供求關(guān)系失衡,災(zāi)害的嚴(yán)重性導(dǎo)致價(jià)格波動(dòng)的范圍等建立定量的數(shù)據(jù)分析方法發(fā)現(xiàn)彼此存在的聯(lián)系。

2 結(jié)論

利用Web挖掘技術(shù)實(shí)現(xiàn)對(duì)糧食信息的監(jiān)測(cè),有利于充分海量的糧食網(wǎng)絡(luò)信息資源,能夠及時(shí)發(fā)現(xiàn)糧食熱點(diǎn)事件,為糧食安全提供預(yù)警服務(wù)。該文著重分析了當(dāng)前糧食方面輿情分析系統(tǒng)存在的不足,提出了解決方案,構(gòu)造了一個(gè)較完善的糧食輿情分析架構(gòu)。通過(guò)各種算法的編碼和改進(jìn),實(shí)現(xiàn)本文所構(gòu)建的系統(tǒng)是進(jìn)一步研究的方向。

參考文獻(xiàn):

[1] 任海果. 基于主題事件的輿情分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].北京:北京郵電大學(xué),2012.

[2 ] Neri F, Aliprandi C,Capeci F,et al. Sentiment Analysis on Social Media[C]. Istanbul, Turke:Advances in Social Networks Analysis and Mining,2012:919-926.

[3]Wang Su, Liang Meiyu, Gao Tian and Du Junping. Realization of Product Quality and Food Security Internet Public Opinion Supervision System[C]. Jinan, China:Proceedings of the 8th World Congress on Intelligent Control and Automation, 2010:2736-2739.

[4] 龍方. 新世紀(jì)中國(guó)糧食安全問(wèn)題研究[J]. 湖南農(nóng)業(yè)大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2007 (3):7-14.

[5] 孫立偉,何國(guó)輝,吳禮發(fā). 網(wǎng)絡(luò)爬蟲(chóng)技術(shù)的研究[J]. 電腦知識(shí)與技術(shù),2010(15):4112-4115.

篇7

摘要:本文以基于數(shù)據(jù)挖掘的決策支持系統(tǒng)方法整合網(wǎng)絡(luò)輿情信息,建立網(wǎng)絡(luò)輿情信息倉(cāng)庫(kù),對(duì)非結(jié)構(gòu)化的模糊復(fù)雜的信息,運(yùn)用數(shù)據(jù)挖掘中文本挖掘技術(shù)有效分析網(wǎng)絡(luò)熱點(diǎn)事件的輿情,及時(shí)發(fā)現(xiàn)重大突發(fā)事件,減少危機(jī)損失,提高政府管理和監(jiān)控輿情危機(jī)的能力。

關(guān)鍵詞:網(wǎng)絡(luò)輿情 數(shù)據(jù)挖掘 決策支持系統(tǒng)

1、引 言

近幾年,隨著Web2. 0的興起與普及,互聯(lián)網(wǎng)已成為一個(gè)開(kāi)放的、個(gè)性化的社會(huì)環(huán)境形態(tài),對(duì)社會(huì)穩(wěn)定和國(guó)家安全的維護(hù)帶來(lái)了嚴(yán)峻挑戰(zhàn)。但是現(xiàn)在我們政府情報(bào)機(jī)構(gòu)網(wǎng)絡(luò)安全管理和監(jiān)控能力比較薄弱,難以適應(yīng)復(fù)雜的環(huán)境。因此,建立基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)輿情預(yù)警決策支持系統(tǒng),對(duì)非結(jié)構(gòu)化的模糊復(fù)雜的信息,運(yùn)用文本挖掘技術(shù)有效分析網(wǎng)絡(luò)輿情事件,及時(shí)發(fā)現(xiàn)重大突發(fā)事件,減少危機(jī)損失,提高政府管理和監(jiān)控能力勢(shì)在必行。

2、基于數(shù)據(jù)挖掘的決策支持系統(tǒng)

決策支持系統(tǒng)(DSS) [1]是利用大量信息,數(shù)據(jù)結(jié)合眾多模型,通過(guò)人機(jī)交互,輔助各級(jí)決策者實(shí)現(xiàn)科學(xué)決策的系統(tǒng)。它是融計(jì)算機(jī)技術(shù)、信息、技術(shù)、人工智能、管理科學(xué)、決策科學(xué)等學(xué)科和技術(shù)于一體的技術(shù)繼承系統(tǒng),包括數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘分析系統(tǒng),由以下三個(gè)主體[2]組成:

(1)模型庫(kù)系統(tǒng)和數(shù)據(jù)庫(kù)系統(tǒng)結(jié)合,作為該系統(tǒng)的基礎(chǔ),為決策問(wèn)題進(jìn)行模型計(jì)算和定量分析,提供輔助決策信息。

(2)知識(shí)庫(kù)系統(tǒng)和數(shù)據(jù)挖掘的結(jié)合,從數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)中挖掘知識(shí)放入專家系統(tǒng)的知識(shí)庫(kù)中,通過(guò)知識(shí)推理定性分析,輔助決策。

(3)數(shù)據(jù)倉(cāng)庫(kù)和OLAP,從數(shù)據(jù)倉(cāng)庫(kù)中提取綜合數(shù)據(jù)和信息來(lái)反映了其內(nèi)在本質(zhì)。

3、基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)輿情預(yù)警決策支持系統(tǒng)的定位

從網(wǎng)絡(luò)輿情預(yù)警決策支持系統(tǒng)的功能和實(shí)現(xiàn)方式對(duì)其定義:基于決策支持系統(tǒng)技術(shù),將聯(lián)機(jī)分析處理、數(shù)據(jù)挖掘模型(文本挖掘模型)、數(shù)據(jù)倉(cāng)庫(kù)、知識(shí)庫(kù)、方法庫(kù)等相結(jié)合,應(yīng)用于情報(bào)機(jī)構(gòu)的網(wǎng)絡(luò)輿情預(yù)警中的人機(jī)結(jié)合系統(tǒng)。

3.1數(shù)據(jù)倉(cāng)庫(kù)

數(shù)據(jù)倉(cāng)庫(kù)[3]的設(shè)計(jì)要滿足決策支持系統(tǒng)的要求,即數(shù)據(jù)要具備概括性、抽象性、統(tǒng)一性三個(gè)特點(diǎn)。所以圖1中數(shù)據(jù)倉(cāng)庫(kù)和部門數(shù)據(jù)庫(kù)加上一個(gè)虛擬層,實(shí)現(xiàn)數(shù)據(jù)挖掘的數(shù)據(jù)清洗,為數(shù)據(jù)倉(cāng)庫(kù)提取有用數(shù)據(jù)。

3.2數(shù)據(jù)挖掘方法

數(shù)據(jù)挖掘[4],簡(jiǎn)單點(diǎn)說(shuō),就是從大量數(shù)據(jù)中尋找規(guī)律的技術(shù),通過(guò)處理海量的、不完全的、隨機(jī)的、結(jié)構(gòu)復(fù)雜的數(shù)據(jù)選擇有用數(shù)據(jù),建立知識(shí)模型。網(wǎng)絡(luò)輿情預(yù)警決策支持系統(tǒng)運(yùn)用數(shù)據(jù)挖掘中文本挖掘技術(shù),包括自動(dòng)分類技術(shù)、自動(dòng)關(guān)聯(lián)技術(shù)、觀點(diǎn)挖掘技術(shù)、自動(dòng)分詞技術(shù)、結(jié)構(gòu)化抽取技術(shù)以及自動(dòng)摘要、關(guān)鍵詞技術(shù)等。

圖1 決策支持結(jié)構(gòu)系統(tǒng)

4、基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)輿情預(yù)警決策支持系統(tǒng)的構(gòu)建

基于數(shù)據(jù)挖掘的決策支持系統(tǒng)采集網(wǎng)絡(luò)中的新聞網(wǎng)頁(yè)、論壇、博客、新聞評(píng)論,貼吧等網(wǎng)絡(luò)資源,發(fā)現(xiàn)突發(fā)性熱點(diǎn)事件,進(jìn)行熱點(diǎn)跟蹤定位和實(shí)時(shí)輿情預(yù)警,幫助政府及時(shí)掌握輿情動(dòng)向,準(zhǔn)確捕捉預(yù)警信息,對(duì)有較大影響的重要事件快速發(fā)現(xiàn)、快速處理,為政府決策提供信息依據(jù)[5]。

4.1數(shù)據(jù)準(zhǔn)備

網(wǎng)絡(luò)輿情預(yù)警需要多樣化的信息,在整理信息的時(shí)候,需要做到全面、準(zhǔn)確、及時(shí)。本系統(tǒng)涉及的信息有:

文本信息:新聞、博客、產(chǎn)品評(píng)論、論壇帖子等文本信息,包括主題、關(guān)鍵詞、時(shí)間、URL等。

詞匯信息:包括現(xiàn)在詞典中的字或詞和現(xiàn)在網(wǎng)絡(luò)用語(yǔ)的語(yǔ)義、適用的語(yǔ)境和是否帶有情感等。

圖像信息:主要是新聞、博客、產(chǎn)品評(píng)論、論壇帖子等上的圖片,包括主題、內(nèi)容、時(shí)間、URL、瀏覽數(shù)量等。

視頻音頻信息:主要是新聞、博客、產(chǎn)品評(píng)論、論壇帖子等上的視頻音頻,包括主題、內(nèi)容、時(shí)間、、URL、瀏覽數(shù)量等。

這些來(lái)自互聯(lián)網(wǎng)的大量信息,通過(guò)收集、整理、存儲(chǔ)、預(yù)處理在數(shù)據(jù)庫(kù)中作為原始數(shù)據(jù),這些數(shù)據(jù)是離散的、模糊的。

4.2系統(tǒng)功能模塊

根據(jù)網(wǎng)絡(luò)輿情預(yù)警的規(guī)劃,如輿情分類、情感分類與趨勢(shì)預(yù)測(cè)、輿情檢索以及統(tǒng)計(jì)分析等,本系統(tǒng)建立了輿情信息采集管理系統(tǒng)、輿情分類管理系統(tǒng)[6]、輿情來(lái)源管理系統(tǒng)、輿情情感分類管理系統(tǒng)和用戶管理系統(tǒng)。

①輿情分類管理系統(tǒng):輿情分類即對(duì)海量信息的自動(dòng)(文本語(yǔ)義分析)分類。通過(guò)關(guān)鍵字樣本、文件樣本、自定義等把原始信息分類,形成分類別(危害國(guó)家安全、危害社會(huì)治安、擾亂社會(huì)秩序等)的分類庫(kù),分類管理可以對(duì)分類的類別數(shù)據(jù)進(jìn)行增加、刪除、修改等操作。

②輿情信息采集管理系統(tǒng):輿情信息采集管理系統(tǒng)對(duì)文本信息、圖像信息、視頻音頻信息的來(lái)源,如新聞、博客、產(chǎn)品評(píng)論、論壇帖子、網(wǎng)站及其網(wǎng)站的權(quán)威性進(jìn)行分析統(tǒng)計(jì)。

③輿情來(lái)源管理系統(tǒng):輿情來(lái)源管理部門對(duì)文本信息、圖像信息、視頻音頻信息的來(lái)源,如新聞、博客、產(chǎn)品評(píng)論、論壇帖子、網(wǎng)站及其網(wǎng)站的權(quán)威性進(jìn)行分析統(tǒng)計(jì)。

④輿情情感分類管理系統(tǒng):輿情分類管理部門從根據(jù)新聞、博客、產(chǎn)品評(píng)論、論壇帖子等收集的文本信息、圖像信息、視頻音頻信息,經(jīng)過(guò)預(yù)處理之后,通過(guò)觀點(diǎn)挖掘方法對(duì)輿情信息的情感傾向進(jìn)行分析,及時(shí)發(fā)現(xiàn)消極情感的信息,以便迅速做出反應(yīng)。

⑤輿情統(tǒng)計(jì)系統(tǒng):統(tǒng)計(jì)輿情分類管理系統(tǒng)和輿情情感分類管理系統(tǒng)的信息,為政府提供報(bào)表或報(bào)文,供政府決策使用。

5、結(jié) 論

基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)輿情預(yù)警決策支持系統(tǒng)可以有效解決現(xiàn)在網(wǎng)絡(luò)輿情預(yù)警系統(tǒng)中存在的問(wèn)題,通過(guò)文本挖掘技術(shù)對(duì)非結(jié)構(gòu)化的模糊復(fù)雜的信息分析處理,及時(shí)發(fā)現(xiàn)重大突發(fā)事件,減少危機(jī)損失,提高政府管理和控制輿情的能力。

參考文獻(xiàn):

篇8

我國(guó)的網(wǎng)絡(luò)輿情研究還是處于初級(jí)階段,一方面,政府投入資金鼓勵(lì)研究,建立了基礎(chǔ)性的理論知識(shí);另一方面,輿情的采集和分析缺乏相應(yīng)的制度,同時(shí)輿情的應(yīng)用也面臨著很大的挑戰(zhàn)。目前只有人民網(wǎng)的輿情監(jiān)測(cè)室和一些企業(yè)開(kāi)發(fā)系統(tǒng)研究,在農(nóng)業(yè)方面則更加缺乏。在國(guó)外,網(wǎng)絡(luò)輿情研究比較早。剛開(kāi)始的研究都與政府有關(guān),特別是與政治生活密切相關(guān)的大型選舉活動(dòng)的選情分析和研究。此外,針對(duì)輿情規(guī)范部分國(guó)家已經(jīng)上升到行政制度層面,提出和采取了一系列的措施。伴隨互聯(lián)網(wǎng)的快速發(fā)展,農(nóng)業(yè)網(wǎng)絡(luò)輿情研究已經(jīng)廣泛發(fā)展,政府研究機(jī)構(gòu)和企業(yè)對(duì)輿情的研究技術(shù)相當(dāng)成熟。

2模型設(shè)計(jì)

云環(huán)境下的農(nóng)業(yè)網(wǎng)絡(luò)輿情監(jiān)測(cè)模型由三部分構(gòu)成,即輿情信息采集層、輿情分析層和輿情服務(wù)層(圖1)。為了對(duì)主流媒體、門戶網(wǎng)站、資訊平臺(tái)、知名論壇、搜索引擎、博客、貼吧等網(wǎng)絡(luò)載體的監(jiān)測(cè),全面掌控互聯(lián)網(wǎng)上與農(nóng)業(yè)相關(guān)的人、地、物、事、組織,不漏掉有價(jià)值的輿情信息,通過(guò)收集相關(guān)網(wǎng)頁(yè)信息,并對(duì)其過(guò)濾、分類;對(duì)已經(jīng)處理與農(nóng)業(yè)相關(guān)的輿情信息進(jìn)行動(dòng)態(tài)分類采集、智能化分析,及時(shí)發(fā)現(xiàn)隱藏?zé)狳c(diǎn)輿情、突發(fā)事件和重大公共事件信息。在整個(gè)過(guò)程中,農(nóng)業(yè)網(wǎng)絡(luò)輿情監(jiān)測(cè)的信息都在云數(shù)據(jù)中心計(jì)算和存儲(chǔ)。

3系統(tǒng)功能模塊

3.1輿情信息采集

輿情信息采集模塊是整個(gè)系統(tǒng)數(shù)據(jù)處理分析的信息源[6]。輿情信息采集主要是由網(wǎng)絡(luò)爬蟲(chóng)來(lái)實(shí)現(xiàn),系統(tǒng)采用NUTCH采集信息,從給定的一個(gè)初始集URLs出發(fā),依次按順序出去URL,獲取該URL指向的網(wǎng)頁(yè),同時(shí)將頁(yè)面中的新鏈接加入到URLs中,不斷重復(fù)上述過(guò)程,直至所有的URLs全部被采集完終止。為了提高網(wǎng)頁(yè)的采集速度,系統(tǒng)設(shè)計(jì)了多個(gè)采集器并行采集,同時(shí)在將采集到頁(yè)面中的鏈接進(jìn)行過(guò)濾,除去重復(fù)的、過(guò)時(shí)的URL(圖2)。上述流程的輸入是給定的URL,URL過(guò)濾規(guī)則和頁(yè)面過(guò)時(shí)判定值,而輸出的是網(wǎng)頁(yè)的正文內(nèi)容。當(dāng)進(jìn)行信息采集時(shí),由于整個(gè)互聯(lián)網(wǎng)包含的信息量太大,在消耗系統(tǒng)資源和網(wǎng)絡(luò)寬帶的情況下,采集有效的頁(yè)面率卻不高。系統(tǒng)對(duì)輿情主題進(jìn)行規(guī)劃,使用主題網(wǎng)絡(luò)爬蟲(chóng),提高系統(tǒng)資源利用率(圖3)。將采集得到的信息存入云數(shù)據(jù)中心,進(jìn)行輿情信息預(yù)處理。信息預(yù)處理主要實(shí)現(xiàn)的功能是解析網(wǎng)頁(yè)正文內(nèi)容、進(jìn)行中文分詞、特征提取和關(guān)鍵詞提取、刪除停用詞[7]。

3.2輿情分析模塊

輿情分析模塊是系統(tǒng)中最核心的處理模塊,利用信息技術(shù)對(duì)預(yù)處理后的輿情信息進(jìn)行分析挖掘,實(shí)現(xiàn)輿情信息的熱點(diǎn)發(fā)現(xiàn)和話題追蹤等(圖4)。本體是通過(guò)某領(lǐng)域內(nèi)諸多知名專家協(xié)作共同構(gòu)建該領(lǐng)域概念體系、公理和體系關(guān)系集合體,以計(jì)算機(jī)所能理解的語(yǔ)言和形式描述、表示和組織知識(shí),促進(jìn)知識(shí)重用、知識(shí)共享和知識(shí)服務(wù)。而農(nóng)業(yè)本體是通過(guò)農(nóng)業(yè)與其他領(lǐng)域(如農(nóng)產(chǎn)品加工、經(jīng)濟(jì)管理等領(lǐng)域)專家的積極參與和通力協(xié)作,從而構(gòu)建的以機(jī)器能理解的形式化語(yǔ)言表示和組織的農(nóng)業(yè)知識(shí)和模型[8]。構(gòu)建農(nóng)業(yè)領(lǐng)域本體,能夠更好的發(fā)現(xiàn)輿情信息,提高預(yù)警能力。敏感話題識(shí)別主要是分析在不同時(shí)間內(nèi)的某一主題關(guān)注程度。隨時(shí)間的變化,話題關(guān)注度也會(huì)出現(xiàn)一定的波動(dòng)。敏感話題不等同于熱點(diǎn)話題,涉及范圍比較廣。敏感話題主要處理過(guò)程包括對(duì)網(wǎng)絡(luò)輿論內(nèi)容進(jìn)行分詞,并針對(duì)當(dāng)前社會(huì)形勢(shì),總結(jié)出目前較為敏感的詞匯,建立農(nóng)業(yè)敏感詞庫(kù)。其具體實(shí)現(xiàn)是將根據(jù)分詞后的結(jié)果與敏感詞庫(kù)中的敏感詞匹配來(lái)完成,從而實(shí)現(xiàn)當(dāng)前網(wǎng)絡(luò)中敏感話題自動(dòng)發(fā)現(xiàn)。熱點(diǎn)話題是文本聚類分析的結(jié)果。其主要流程是將預(yù)處理的文本信息歸入相關(guān)的話題中,文本聚類就是將話題按照文檔進(jìn)行聚類,從而發(fā)現(xiàn)新的熱點(diǎn)。話題追蹤是得到的熱點(diǎn)話題與用戶感興趣的進(jìn)行比較,若判斷是用戶感興趣的則交給用戶,這里還可以通過(guò)機(jī)器學(xué)習(xí)不斷地向用戶興趣進(jìn)行修正,使得系統(tǒng)能夠更好地滿足用戶的需求。此外,熱點(diǎn)發(fā)現(xiàn)還可以通過(guò)對(duì)用戶的訪問(wèn)日志信息挖掘。用戶在瀏覽網(wǎng)頁(yè)時(shí),網(wǎng)頁(yè)日志中會(huì)記載相應(yīng)的IP地址、瀏覽時(shí)間和URL地址等信息,通過(guò)統(tǒng)計(jì)分析日志得到某地區(qū)某時(shí)某刻的熱點(diǎn)信息。另外,還可以通過(guò)統(tǒng)計(jì)用戶在某段時(shí)間內(nèi)搜索的關(guān)鍵詞量,來(lái)描述網(wǎng)民關(guān)注點(diǎn)的產(chǎn)生和變化過(guò)程,甚至可以追蹤到輿情產(chǎn)生和變換的源頭。

3.3輿情服務(wù)平臺(tái)

輿情服務(wù)平臺(tái)是系統(tǒng)和用戶的交互界面。系統(tǒng)在經(jīng)過(guò)輿情分析之后,將產(chǎn)生的結(jié)果結(jié)合可視化技術(shù)呈現(xiàn)給用戶。同時(shí)也可以進(jìn)行個(gè)性化的定制將農(nóng)業(yè)輿情報(bào)告提供給輿情監(jiān)管部門或者決策者,決策者或者監(jiān)管部門在進(jìn)行輿情報(bào)告評(píng)估基礎(chǔ)上產(chǎn)生新的輿情需求,進(jìn)行輿情采集主題規(guī)劃。輿情服務(wù)還包括敏感話題的趨勢(shì)分析、熱點(diǎn)話題排行榜等,當(dāng)這些超過(guò)了系統(tǒng)預(yù)先設(shè)定好的閥值,系統(tǒng)將發(fā)出預(yù)警信息,提前采取措施應(yīng)對(duì)。

4結(jié)束語(yǔ)

推薦期刊