一、“大數(shù)據(jù)”時(shí)代的數(shù)據(jù)挖掘的應(yīng)用與方法數(shù)據(jù)挖掘是在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識(shí)。
所以它所得到的信息應(yīng)具有未知,有效和實(shí)用三個(gè)特征。因此數(shù)據(jù)挖掘技術(shù)從一開始就是面向應(yīng)用的,目前數(shù)據(jù)挖掘技術(shù)在企業(yè)市場(chǎng)營銷中得到了比較普遍的應(yīng)用。
它包括:數(shù)據(jù)庫營銷、客戶群體劃分、背景分析、交叉銷售等市場(chǎng)分析行為,以及客戶流失性分析、客戶信用記分、欺詐發(fā)現(xiàn)等。審計(jì)部門的數(shù)據(jù)挖掘以往偏重于對(duì)大金額數(shù)據(jù)的分析,來確實(shí)是否存在問題,以及問題在數(shù)據(jù)中的表現(xiàn),而隨著績效審計(jì)的興起,審計(jì)部門也需要通過數(shù)據(jù)來對(duì)被審計(jì)單位的各類行為做出審計(jì)評(píng)價(jià),這些也都需要數(shù)據(jù)的支撐。
數(shù)據(jù)挖掘的方法有很多,它們分別從不同的角度對(duì)數(shù)據(jù)進(jìn)行挖掘。其中絕大部分都可以用于審計(jì)工作中。
1. 數(shù)據(jù)概化。數(shù)據(jù)庫中通常存放著大量的細(xì)節(jié)數(shù)據(jù), 通過數(shù)據(jù)概化可將大量與任務(wù)相關(guān)的數(shù)據(jù)集從較低的概念層抽象到較高的概念層。
數(shù)據(jù)概化可應(yīng)用于審計(jì)數(shù)據(jù)分析中的描述式挖掘, 審計(jì)人員可從不同的粒度和不同的角度描述數(shù)據(jù)集, 從而了解某類數(shù)據(jù)的概貌。大量研究證實(shí), 與正常的財(cái)務(wù)報(bào)告相比, 虛假財(cái)務(wù)報(bào)告常具有某種結(jié)構(gòu)上的特征。
審計(jì)人員可以采用概念描述技術(shù)對(duì)存儲(chǔ)在被審計(jì)數(shù)據(jù)庫中的數(shù)據(jù)實(shí)施數(shù)據(jù)挖掘, 通過使用屬性概化、屬性相關(guān)分析等數(shù)據(jù)概化技術(shù)將詳細(xì)的財(cái)務(wù)數(shù)據(jù)在較高層次上表達(dá)出來, 以得到財(cái)務(wù)報(bào)告的一般屬性特征描述, 從而為審計(jì)人員判斷虛假財(cái)務(wù)報(bào)告提供依據(jù)。2.統(tǒng)計(jì)分析。
它是基于模型的方法, 包括回歸分析、因子分析和判別分析等, 用此方法可對(duì)數(shù)據(jù)進(jìn)行分類和預(yù)測(cè)。通過分類挖掘?qū)Ρ粚徲?jì)數(shù)據(jù)庫中的各類數(shù)據(jù)挖掘出其數(shù)據(jù)的描述或模型, 或者審計(jì)人員通過建立的統(tǒng)計(jì)模型對(duì)被審計(jì)單位的大量財(cái)務(wù)或業(yè)務(wù)歷史數(shù)據(jù)進(jìn)行預(yù)測(cè)分析, 根據(jù)分析的預(yù)測(cè)值和審計(jì)值進(jìn)行比較, 都能幫助審計(jì)人員從中發(fā)現(xiàn)審計(jì)疑點(diǎn), 從而將其列為審計(jì)重點(diǎn)。
3. 聚類分析。聚類分析是把一組個(gè)體按照相似性歸成若干類別, 目的是使得同一類別的個(gè)體之間的距離盡可能地小, 而不同類別的個(gè)體間的距離盡可能地大, 該方法可為不同的信息用戶提供不同類別的信息集。
如審計(jì)人員可運(yùn)用該方法識(shí)別密集和稀疏的區(qū)域, 從而發(fā)現(xiàn)被審計(jì)數(shù)據(jù)的分布模式, 以及數(shù)據(jù)屬性間的關(guān)系, 以進(jìn)一步確定重點(diǎn)審計(jì)領(lǐng)域。企業(yè)的財(cái)務(wù)報(bào)表數(shù)據(jù)會(huì)隨著企業(yè)經(jīng)營業(yè)務(wù)的變化而變化, 一般來說, 真實(shí)的財(cái)務(wù)報(bào)表中主要項(xiàng)目的數(shù)據(jù)變動(dòng)具有一定的規(guī)律性, 如果其變動(dòng)表現(xiàn)異常, 表明數(shù)據(jù)中的異常點(diǎn)可能隱藏了重要的信息, 反映了被審計(jì)報(bào)表項(xiàng)目數(shù)據(jù)可能存在虛假成分。
4. 關(guān)聯(lián)分析。它通過利用關(guān)聯(lián)規(guī)則可以從操作數(shù)據(jù)庫的所有細(xì)節(jié)或事務(wù)中抽取頻繁出現(xiàn)的模式, 其目的是挖掘隱藏在數(shù)據(jù)間的相互關(guān)系。
利用關(guān)聯(lián)分析, 審計(jì)人員可通過對(duì)被審計(jì)數(shù)據(jù)庫中的數(shù)據(jù)利用關(guān)聯(lián)規(guī)則進(jìn)行挖掘分析, 找出被審計(jì)數(shù)據(jù)庫中不同數(shù)據(jù)項(xiàng)之間的聯(lián)系, 從而發(fā)現(xiàn)存在異常聯(lián)系的數(shù)據(jù)項(xiàng), 在此基礎(chǔ)上通過進(jìn)一步分析, 發(fā)現(xiàn)審計(jì)疑點(diǎn)。 二、應(yīng)對(duì)“大數(shù)據(jù)”時(shí)代,審計(jì)分析應(yīng)做出的調(diào)整從以上分析過程中,我們不難看出“大數(shù)據(jù)”時(shí)代的數(shù)據(jù)存貯、處理、分析以及挖掘的各個(gè)方面雖然與傳統(tǒng)方式相比,在技術(shù)層面上有了較大的改變,但是在基本的原理方面并沒有顯著的改變,原有的審計(jì)分析模式?jīng)]有必要因?yàn)椤按髷?shù)據(jù)”時(shí)代的來臨而急于做出相應(yīng)的改變。
然而“大數(shù)據(jù)”時(shí)代在給審計(jì)分析帶來機(jī)遇的同時(shí),還是給我們帶給了相當(dāng)大的沖擊,對(duì)此我們有必要引起相當(dāng)?shù)闹匾?,并在日后的信息化建設(shè)過程做出相應(yīng)的調(diào)整。1、數(shù)據(jù)的存貯與處理。
大數(shù)據(jù)分析應(yīng)用需求正在影響著數(shù)據(jù)存儲(chǔ)基礎(chǔ)設(shè)施的發(fā)展。隨著結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)量的持續(xù)增長,以及分析數(shù)據(jù)來源的多樣化,此前存儲(chǔ)系統(tǒng)的設(shè)計(jì)已經(jīng)無法滿足大數(shù)據(jù)應(yīng)用的需要。
基于塊和文件的存儲(chǔ)系統(tǒng)的架構(gòu)設(shè)計(jì)需要進(jìn)行調(diào)整以適應(yīng)這些新的要求。審計(jì)部門在選擇相應(yīng)的存貯系統(tǒng)的時(shí)候,要對(duì)非結(jié)構(gòu)化數(shù)據(jù)有足夠的重視,做好采集的相關(guān)準(zhǔn)備。
同時(shí)隨著采集數(shù)據(jù)的單位和年份越來越多,數(shù)據(jù)量必然是會(huì)有大規(guī)模的增長。即使是海量數(shù)據(jù)存儲(chǔ)系統(tǒng)也一定要有相應(yīng)等級(jí)的擴(kuò)展能力。
存儲(chǔ)系統(tǒng)的擴(kuò)展一定要簡便,可以通過增加模塊或磁盤柜來增加容量,甚至不需要停機(jī)。同時(shí),為了提高數(shù)據(jù)的處理能力,解決I/O的瓶頸問題,可以考慮各種模式的固態(tài)存儲(chǔ)設(shè)備,小到簡單的在服務(wù)器內(nèi)部做高速緩存,大到全固態(tài)介質(zhì)可擴(kuò)展存儲(chǔ)系統(tǒng)通過高性能閃存存儲(chǔ)都是可以考慮使用的設(shè)備。
2、非結(jié)構(gòu)化的數(shù)據(jù)處理。非結(jié)構(gòu)化數(shù)據(jù)的多元化給數(shù)據(jù)分析帶來新的挑戰(zhàn),我們需要一套工具系統(tǒng)的去分析,提煉數(shù)據(jù)。
語義引擎需要設(shè)計(jì)到有足夠的人工智能以足以從數(shù)據(jù)中主動(dòng)地提取信息。3、可視化的分析。
數(shù)據(jù)分析的使用者有數(shù)據(jù)分析專家,同時(shí)還有普通用戶,但是他們二者對(duì)于數(shù)據(jù)分析最基本的要求就是可視化分析,因?yàn)榭梢暬治瞿軌蛑庇^的呈現(xiàn)大數(shù)據(jù)特點(diǎn),同時(shí)能夠非常容易被讀者所接受,就如同看圖說話一樣簡單明了。“一個(gè)平臺(tái)、兩個(gè)中心”建設(shè),是審計(jì)署目前信息化建設(shè)的重要內(nèi)容。
通過數(shù)據(jù)中心的建設(shè),可以在相當(dāng)程度上解決數(shù)據(jù)存。
大數(shù)據(jù)分析是通過對(duì)大規(guī)模、多樣化的數(shù)據(jù)進(jìn)行科學(xué)化采集和分析,從而挖掘出其中隱藏價(jià)值的過程。大數(shù)據(jù)時(shí)代的到來,給現(xiàn)代企業(yè)審計(jì)提出了新的要求和新的挑戰(zhàn)。如何在信息時(shí)代更有效地進(jìn)行企業(yè)審計(jì)是審計(jì)機(jī)關(guān)需要面對(duì)和解決的問題。
一、大數(shù)據(jù)分析是創(chuàng)新企業(yè)審計(jì)技術(shù)方法的必然要求
“審計(jì)工作,就是讓數(shù)據(jù)說話”。傳統(tǒng)的企業(yè)審計(jì)是事后審計(jì),在事后對(duì)企業(yè)的會(huì)計(jì)報(bào)表、賬簿和憑證等財(cái)務(wù)資料進(jìn)行抽查核實(shí),是讓財(cái)務(wù)數(shù)據(jù)說話的事后審計(jì)。大數(shù)據(jù)時(shí)代是實(shí)時(shí)審計(jì),實(shí)時(shí)采集企業(yè)的業(yè)務(wù)數(shù)據(jù),并與企業(yè)外部的銀行、工商、稅務(wù)、物流、其他企業(yè)業(yè)務(wù)數(shù)據(jù)等進(jìn)行綜合分析與挖掘,實(shí)時(shí)判斷企業(yè)生產(chǎn)經(jīng)營情況,甚至基于當(dāng)前狀態(tài)對(duì)企業(yè)未來發(fā)展進(jìn)行短期預(yù)判,是讓業(yè)務(wù)數(shù)據(jù)說話的實(shí)時(shí)審計(jì)。現(xiàn)階段,我們正處在由傳統(tǒng)審計(jì)向大數(shù)據(jù)審計(jì)的轉(zhuǎn)化過程中,但仍處于以財(cái)務(wù)審計(jì)為主、外部數(shù)據(jù)核查為輔的大數(shù)據(jù)初級(jí)階段。
要在一個(gè)行業(yè)中應(yīng)用大數(shù)據(jù)技術(shù),不能一蹴而就,前期探索階段需要以技術(shù)和工具為主,從分析工具及分析思路出發(fā)挖掘價(jià)值;后期則以數(shù)據(jù)為主,從數(shù)據(jù)本身出發(fā)挖掘價(jià)值。在當(dāng)前的企業(yè)審計(jì)實(shí)踐中,大數(shù)據(jù)應(yīng)用較為原始,主要體現(xiàn)在數(shù)據(jù)分析理念的應(yīng)用上。即通過采集企業(yè)某業(yè)務(wù)流程的全部數(shù)據(jù),結(jié)合外部信息系統(tǒng)或記錄臺(tái)賬,對(duì)該業(yè)務(wù)的流程進(jìn)行全面多維度對(duì)比分析。通過貫徹大數(shù)據(jù)“樣本=總體”、“相關(guān)>因果”的理念,數(shù)據(jù)分析不再拘泥于抽樣調(diào)查,也不僅僅局限于業(yè)務(wù)流程本身,而是以全體業(yè)務(wù)數(shù)據(jù)關(guān)聯(lián)外部數(shù)據(jù),從業(yè)務(wù)本身及相關(guān)流程進(jìn)行分析挖掘。大數(shù)據(jù)審計(jì)思維對(duì)企業(yè)的業(yè)務(wù)數(shù)據(jù)分析共分為以下6個(gè)步驟:
第一步是對(duì)業(yè)務(wù)或問題進(jìn)行了解。要了解企業(yè)業(yè)務(wù)的性質(zhì)、業(yè)務(wù)流程、關(guān)鍵節(jié)點(diǎn)、管控可能存在的薄弱環(huán)節(jié)和漏洞,從各個(gè)角度理解企業(yè)業(yè)務(wù)并初步提出可能存在的問題,這是分析思路和分析模型的出發(fā)點(diǎn)。
第二步是對(duì)數(shù)據(jù)進(jìn)行了解。要了解該業(yè)務(wù)會(huì)產(chǎn)生什么數(shù)據(jù)、數(shù)據(jù)存儲(chǔ)位置、存儲(chǔ)形式和結(jié)構(gòu)、不同階段業(yè)務(wù)活動(dòng)在數(shù)據(jù)中如何體現(xiàn)、數(shù)據(jù)庫的設(shè)計(jì)結(jié)構(gòu)和數(shù)據(jù)字典以及更新策略如何設(shè)計(jì)等。除本業(yè)務(wù)外,還需了解該業(yè)務(wù)的外部活動(dòng),互動(dòng)的外部活動(dòng)產(chǎn)生的數(shù)據(jù)存儲(chǔ)位置、存儲(chǔ)形式等,這是對(duì)數(shù)據(jù)進(jìn)行分析的基礎(chǔ)工作。
第三步是準(zhǔn)備數(shù)據(jù)。若進(jìn)入真正的大數(shù)據(jù)時(shí)代,此步驟會(huì)因數(shù)據(jù)太大無法移動(dòng)而被舍棄,但現(xiàn)階段還不能跳過。準(zhǔn)備數(shù)據(jù)即先采集目標(biāo)業(yè)務(wù)信息系統(tǒng)的所有數(shù)據(jù),并根據(jù)第二步對(duì)數(shù)據(jù)的了解對(duì)所收集數(shù)據(jù)進(jìn)行整理、重組,在可行的前提下,進(jìn)行丟棄數(shù)據(jù)中的冗余、噪聲,對(duì)明顯的錯(cuò)誤進(jìn)行糾錯(cuò)等清洗操作,這是用于分析的數(shù)據(jù)原材料。
第四步是正式對(duì)數(shù)據(jù)進(jìn)行分析,以第一步提出的問題為目標(biāo),采取合適的分析方法,建立相應(yīng)的分析模型,對(duì)第三步準(zhǔn)備好的數(shù)據(jù)進(jìn)行分析和挖掘,找出其中所需的結(jié)果。分析方法和模型不是越復(fù)雜越好,在能達(dá)成目標(biāo)的前提下,越簡單的分析模型越有效。
第五步是形成觀點(diǎn)或結(jié)論,把分析出的數(shù)據(jù)結(jié)果加以解讀,以數(shù)據(jù)分析動(dòng)態(tài)或數(shù)據(jù)分析報(bào)告的模式,用可視化、通俗語言的方式來表達(dá)整個(gè)分析步驟及結(jié)果,包括此次數(shù)據(jù)分析的目標(biāo)、分析思路和方法、分析結(jié)果,并提出建議關(guān)注的重點(diǎn)和延伸方向。
第六步是實(shí)證使用,將第五步形成的分析結(jié)果用于審計(jì)實(shí)踐,來幫助指引審計(jì)方向、推進(jìn)實(shí)際工作。同時(shí),實(shí)證使用也是對(duì)前期分析思路正確與否、完善與否的重要驗(yàn)證。若在實(shí)際操作時(shí)發(fā)現(xiàn)分析結(jié)果與實(shí)際情況出入較大,則可以反饋至數(shù)據(jù)分析組,幫助數(shù)據(jù)分析團(tuán)隊(duì)完善對(duì)業(yè)務(wù)和數(shù)據(jù)的理解及分析方法的思考,調(diào)整分析模型,必要時(shí)重新調(diào)整挖掘方向。
一、“大數(shù)據(jù)”時(shí)代的數(shù)據(jù)挖掘的應(yīng)用與方法數(shù)據(jù)挖掘是在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識(shí)。
所以它所得到的信息應(yīng)具有未知,有效和實(shí)用三個(gè)特征。因此數(shù)據(jù)挖掘技術(shù)從一開始就是面向應(yīng)用的,目前數(shù)據(jù)挖掘技術(shù)在企業(yè)市場(chǎng)營銷中得到了比較普遍的應(yīng)用。
它包括:數(shù)據(jù)庫營銷、客戶群體劃分、背景分析、交叉銷售等市場(chǎng)分析行為,以及客戶流失性分析、客戶信用記分、欺詐發(fā)現(xiàn)等。審計(jì)部門的數(shù)據(jù)挖掘以往偏重于對(duì)大金額數(shù)據(jù)的分析,來確實(shí)是否存在問題,以及問題在數(shù)據(jù)中的表現(xiàn),而隨著績效審計(jì)的興起,審計(jì)部門也需要通過數(shù)據(jù)來對(duì)被審計(jì)單位的各類行為做出審計(jì)評(píng)價(jià),這些也都需要數(shù)據(jù)的支撐。
數(shù)據(jù)挖掘的方法有很多,它們分別從不同的角度對(duì)數(shù)據(jù)進(jìn)行挖掘。其中絕大部分都可以用于審計(jì)工作中。
1. 數(shù)據(jù)概化。數(shù)據(jù)庫中通常存放著大量的細(xì)節(jié)數(shù)據(jù), 通過數(shù)據(jù)概化可將大量與任務(wù)相關(guān)的數(shù)據(jù)集從較低的概念層抽象到較高的概念層。
數(shù)據(jù)概化可應(yīng)用于審計(jì)數(shù)據(jù)分析中的描述式挖掘, 審計(jì)人員可從不同的粒度和不同的角度描述數(shù)據(jù)集, 從而了解某類數(shù)據(jù)的概貌。大量研究證實(shí), 與正常的財(cái)務(wù)報(bào)告相比, 虛假財(cái)務(wù)報(bào)告常具有某種結(jié)構(gòu)上的特征。
審計(jì)人員可以采用概念描述技術(shù)對(duì)存儲(chǔ)在被審計(jì)數(shù)據(jù)庫中的數(shù)據(jù)實(shí)施數(shù)據(jù)挖掘, 通過使用屬性概化、屬性相關(guān)分析等數(shù)據(jù)概化技術(shù)將詳細(xì)的財(cái)務(wù)數(shù)據(jù)在較高層次上表達(dá)出來, 以得到財(cái)務(wù)報(bào)告的一般屬性特征描述, 從而為審計(jì)人員判斷虛假財(cái)務(wù)報(bào)告提供依據(jù)。2.統(tǒng)計(jì)分析。
它是基于模型的方法, 包括回歸分析、因子分析和判別分析等, 用此方法可對(duì)數(shù)據(jù)進(jìn)行分類和預(yù)測(cè)。通過分類挖掘?qū)Ρ粚徲?jì)數(shù)據(jù)庫中的各類數(shù)據(jù)挖掘出其數(shù)據(jù)的描述或模型, 或者審計(jì)人員通過建立的統(tǒng)計(jì)模型對(duì)被審計(jì)單位的大量財(cái)務(wù)或業(yè)務(wù)歷史數(shù)據(jù)進(jìn)行預(yù)測(cè)分析, 根據(jù)分析的預(yù)測(cè)值和審計(jì)值進(jìn)行比較, 都能幫助審計(jì)人員從中發(fā)現(xiàn)審計(jì)疑點(diǎn), 從而將其列為審計(jì)重點(diǎn)。
3. 聚類分析。聚類分析是把一組個(gè)體按照相似性歸成若干類別, 目的是使得同一類別的個(gè)體之間的距離盡可能地小, 而不同類別的個(gè)體間的距離盡可能地大, 該方法可為不同的信息用戶提供不同類別的信息集。
如審計(jì)人員可運(yùn)用該方法識(shí)別密集和稀疏的區(qū)域, 從而發(fā)現(xiàn)被審計(jì)數(shù)據(jù)的分布模式, 以及數(shù)據(jù)屬性間的關(guān)系, 以進(jìn)一步確定重點(diǎn)審計(jì)領(lǐng)域。企業(yè)的財(cái)務(wù)報(bào)表數(shù)據(jù)會(huì)隨著企業(yè)經(jīng)營業(yè)務(wù)的變化而變化, 一般來說, 真實(shí)的財(cái)務(wù)報(bào)表中主要項(xiàng)目的數(shù)據(jù)變動(dòng)具有一定的規(guī)律性, 如果其變動(dòng)表現(xiàn)異常, 表明數(shù)據(jù)中的異常點(diǎn)可能隱藏了重要的信息, 反映了被審計(jì)報(bào)表項(xiàng)目數(shù)據(jù)可能存在虛假成分。
4. 關(guān)聯(lián)分析。它通過利用關(guān)聯(lián)規(guī)則可以從操作數(shù)據(jù)庫的所有細(xì)節(jié)或事務(wù)中抽取頻繁出現(xiàn)的模式, 其目的是挖掘隱藏在數(shù)據(jù)間的相互關(guān)系。
利用關(guān)聯(lián)分析, 審計(jì)人員可通過對(duì)被審計(jì)數(shù)據(jù)庫中的數(shù)據(jù)利用關(guān)聯(lián)規(guī)則進(jìn)行挖掘分析, 找出被審計(jì)數(shù)據(jù)庫中不同數(shù)據(jù)項(xiàng)之間的聯(lián)系, 從而發(fā)現(xiàn)存在異常聯(lián)系的數(shù)據(jù)項(xiàng), 在此基礎(chǔ)上通過進(jìn)一步分析, 發(fā)現(xiàn)審計(jì)疑點(diǎn)。 二、應(yīng)對(duì)“大數(shù)據(jù)”時(shí)代,審計(jì)分析應(yīng)做出的調(diào)整從以上分析過程中,我們不難看出“大數(shù)據(jù)”時(shí)代的數(shù)據(jù)存貯、處理、分析以及挖掘的各個(gè)方面雖然與傳統(tǒng)方式相比,在技術(shù)層面上有了較大的改變,但是在基本的原理方面并沒有顯著的改變,原有的審計(jì)分析模式?jīng)]有必要因?yàn)椤按髷?shù)據(jù)”時(shí)代的來臨而急于做出相應(yīng)的改變。
然而“大數(shù)據(jù)”時(shí)代在給審計(jì)分析帶來機(jī)遇的同時(shí),還是給我們帶給了相當(dāng)大的沖擊,對(duì)此我們有必要引起相當(dāng)?shù)闹匾?,并在日后的信息化建設(shè)過程做出相應(yīng)的調(diào)整。1、數(shù)據(jù)的存貯與處理。
大數(shù)據(jù)分析應(yīng)用需求正在影響著數(shù)據(jù)存儲(chǔ)基礎(chǔ)設(shè)施的發(fā)展。隨著結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)量的持續(xù)增長,以及分析數(shù)據(jù)來源的多樣化,此前存儲(chǔ)系統(tǒng)的設(shè)計(jì)已經(jīng)無法滿足大數(shù)據(jù)應(yīng)用的需要。
基于塊和文件的存儲(chǔ)系統(tǒng)的架構(gòu)設(shè)計(jì)需要進(jìn)行調(diào)整以適應(yīng)這些新的要求。審計(jì)部門在選擇相應(yīng)的存貯系統(tǒng)的時(shí)候,要對(duì)非結(jié)構(gòu)化數(shù)據(jù)有足夠的重視,做好采集的相關(guān)準(zhǔn)備。
同時(shí)隨著采集數(shù)據(jù)的單位和年份越來越多,數(shù)據(jù)量必然是會(huì)有大規(guī)模的增長。即使是海量數(shù)據(jù)存儲(chǔ)系統(tǒng)也一定要有相應(yīng)等級(jí)的擴(kuò)展能力。
存儲(chǔ)系統(tǒng)的擴(kuò)展一定要簡便,可以通過增加模塊或磁盤柜來增加容量,甚至不需要停機(jī)。同時(shí),為了提高數(shù)據(jù)的處理能力,解決I/O的瓶頸問題,可以考慮各種模式的固態(tài)存儲(chǔ)設(shè)備,小到簡單的在服務(wù)器內(nèi)部做高速緩存,大到全固態(tài)介質(zhì)可擴(kuò)展存儲(chǔ)系統(tǒng)通過高性能閃存存儲(chǔ)都是可以考慮使用的設(shè)備。
2、非結(jié)構(gòu)化的數(shù)據(jù)處理。非結(jié)構(gòu)化數(shù)據(jù)的多元化給數(shù)據(jù)分析帶來新的挑戰(zhàn),我們需要一套工具系統(tǒng)的去分析,提煉數(shù)據(jù)。
語義引擎需要設(shè)計(jì)到有足夠的人工智能以足以從數(shù)據(jù)中主動(dòng)地提取信息。3、可視化的分析。
數(shù)據(jù)分析的使用者有數(shù)據(jù)分析專家,同時(shí)還有普通用戶,但是他們二者對(duì)于數(shù)據(jù)分析最基本的要求就是可視化分析,因?yàn)榭梢暬治瞿軌蛑庇^的呈現(xiàn)大數(shù)據(jù)特點(diǎn),同時(shí)能夠非常容易被讀者所接受,就如同看圖說話一樣簡單明了。“一個(gè)平臺(tái)、兩個(gè)中心”建設(shè),是審計(jì)署目前信息化建設(shè)的重要內(nèi)容。
通過數(shù)據(jù)中心的建設(shè),可以在相當(dāng)程度上解決數(shù)據(jù)存。
審計(jì)的一般方法,按照審計(jì)工作的順序和會(huì)計(jì)業(yè)務(wù)處理程序的關(guān)系,有順查法和逆查法之分。
(一)順查法。又叫正查法,它是按照會(huì)計(jì)業(yè)務(wù)處理程序進(jìn)行分類審查的一種方法,即按照所有原始憑證的發(fā)生時(shí)間順序進(jìn)行檢查,逐一核對(duì)。
(二)逆查法。又叫倒查法,它是按照會(huì)計(jì)業(yè)務(wù)處理的相反程序既在檢查過程中逆著記賬程序進(jìn)行檢查的方法。
審計(jì)方法按照審查經(jīng)濟(jì)業(yè)務(wù)資料的規(guī)模大小和收集審計(jì)證據(jù)的范圍的大小不同,又有詳查法和抽樣法之分。(一)詳查法。
又稱詳細(xì)審計(jì),是指被審計(jì)單位一定時(shí)期內(nèi)的全部會(huì)計(jì)資料(包括憑證、賬簿和報(bào)表)進(jìn)行詳細(xì)的審核檢查,以判斷評(píng)價(jià)被審單位經(jīng)濟(jì)活動(dòng)的合法性、真實(shí)性和效益性的一種審計(jì)方法。(二)抽樣法。
又稱抽樣審計(jì),是指從被審計(jì)單位一定時(shí)期內(nèi)的會(huì)計(jì)資料(包括憑證、賬簿和報(bào)表)按照一定的方法抽出其中的一部分進(jìn)行審查,借以推斷總體有無錯(cuò)誤和舞弊的一種方法,進(jìn)而判斷評(píng)價(jià)被審單位經(jīng)濟(jì)活動(dòng)的合法性、真實(shí)性的效益性的一種審計(jì)方法。
一、創(chuàng)新大數(shù)據(jù)審計(jì)思路。在大數(shù)據(jù)環(huán)境的審計(jì)工作要牢固樹立起三種思想:一是數(shù)據(jù)先行思想。隨著信息技術(shù)的日益發(fā)展與廣泛應(yīng)用,被審計(jì)單位的經(jīng)營、管理和核算模式正在由傳統(tǒng)的會(huì)計(jì)核算、經(jīng)營管理系統(tǒng)的構(gòu)成要素轉(zhuǎn)向高效、復(fù)雜的信息系統(tǒng)。審計(jì)人員所面臨的原始資料,不再只是手工憑證、賬簿和報(bào)表,而是具有高度概括性、模糊性、關(guān)聯(lián)性的海量電子數(shù)據(jù)。這就需要審計(jì)人員牢固樹立以數(shù)據(jù)為核心,數(shù)據(jù)分析先行、數(shù)據(jù)分行與現(xiàn)場(chǎng)核查相結(jié)合相融合的思想方法,才能在新形勢(shì)下有效推動(dòng)實(shí)現(xiàn)審計(jì)監(jiān)督全覆蓋。二是緊跟信息流向思想。在大數(shù)據(jù)背景下,要充分利用信息化的手段,關(guān)注資金的走向、物資的走向、業(yè)務(wù)的走向,從中發(fā)現(xiàn)疑點(diǎn),深挖嚴(yán)查。三是多維度數(shù)據(jù)關(guān)聯(lián)分析思想。強(qiáng)化政府財(cái)政預(yù)算數(shù)據(jù)和預(yù)算執(zhí)行單位數(shù)據(jù)的關(guān)聯(lián)分析、財(cái)政數(shù)據(jù)與宏觀經(jīng)濟(jì)數(shù)據(jù)的關(guān)聯(lián)分析、財(cái)務(wù)數(shù)據(jù)與部門業(yè)務(wù)數(shù)據(jù)的關(guān)聯(lián)分析、不同領(lǐng)域和專業(yè)間的橫向關(guān)聯(lián)分析、財(cái)政金融企業(yè)社保等相互間的關(guān)聯(lián)分析。只有通過多方數(shù)據(jù)的關(guān)聯(lián)分析、整合各種信息資源,才能真正實(shí)現(xiàn)審計(jì)模式的創(chuàng)新;只有通過數(shù)據(jù)的關(guān)聯(lián)分析, 才能實(shí)現(xiàn)數(shù)據(jù)的立體化、多維度挖掘,提升數(shù)據(jù)分析的質(zhì)量、實(shí)現(xiàn)數(shù)據(jù)的有效利用。
二、開拓大數(shù)據(jù)審計(jì)視野。目前的政府審計(jì),主要是對(duì)政府各部門及其他公共機(jī)構(gòu)財(cái)務(wù)報(bào)告的真實(shí)性、公允性,運(yùn)用公共資源的經(jīng)濟(jì)性、效益性、效果性,以及提供公共服務(wù)的質(zhì)量進(jìn)行審計(jì);對(duì)公共性、財(cái)政性資金的收支結(jié)果及其直接支配者的監(jiān)督。隨著全覆蓋審計(jì)要求“全面審計(jì),突出重點(diǎn)”向縱深推進(jìn),以及建構(gòu)審計(jì)“免疫系統(tǒng)”已成客觀需要。因此,對(duì)于海量數(shù)據(jù)不僅需要審計(jì)的“平面掃瞄”,更要“立體透視”,不僅對(duì)所有的財(cái)政財(cái)務(wù)收支情況執(zhí)行進(jìn)行檢查,還要對(duì)形成其行為的各個(gè)環(huán)節(jié)、或所涉及的過程進(jìn)行檢查,對(duì)制定、執(zhí)行的相關(guān)公共政策的運(yùn)行機(jī)制進(jìn)行評(píng)估,對(duì)制定、執(zhí)行公共政策的主要負(fù)責(zé)人的履職績效進(jìn)行監(jiān)督等。通過多維度數(shù)據(jù)分析,從體制、機(jī)制、制度性的層面揭示問題,預(yù)警經(jīng)濟(jì)社會(huì)發(fā)展中的突出矛盾和風(fēng)險(xiǎn),推動(dòng)深化改革和制度創(chuàng)新,維護(hù)國家經(jīng)濟(jì)安全和服務(wù)可持續(xù)發(fā)展。
三、改進(jìn)大數(shù)據(jù)審計(jì)模式。利用大數(shù)據(jù)審計(jì)信息平臺(tái)系統(tǒng),開展多維度數(shù)據(jù)分析,通過大數(shù)據(jù)提升審計(jì)效益效率。一是完善數(shù)字化審計(jì)制度機(jī)制。從數(shù)據(jù)的報(bào)送、歸集、分類、分析、應(yīng)用、保密、存儲(chǔ)與讀取等全鏈條各方面進(jìn)行建章立制,既確保大數(shù)據(jù)的開發(fā)利用有序有效,也保證大數(shù)據(jù)運(yùn)用的健康安全,確保大數(shù)據(jù)環(huán)境下的數(shù)字化審計(jì)順利推進(jìn)。二是組建專業(yè)數(shù)據(jù)攻關(guān)組。在大數(shù)據(jù)環(huán)境下,審計(jì)組織管理方式要注重整合審計(jì)力量,在全局、甚至審計(jì)系統(tǒng)范圍內(nèi)抽調(diào)業(yè)務(wù)骨干成立審前調(diào)研組、數(shù)據(jù)攻關(guān)組、審計(jì)核查組,探索“集中分析、發(fā)現(xiàn)疑點(diǎn)、分散核查、系統(tǒng)研究”的審計(jì)模式,提高審計(jì)的質(zhì)量和效率。三是充分挖掘利用大數(shù)據(jù)。從關(guān)聯(lián)數(shù)據(jù)中發(fā)現(xiàn)所蘊(yùn)含的規(guī)律和特點(diǎn),挖掘出審計(jì)線索,使審計(jì)資源效能最大化;通過對(duì)海量數(shù)據(jù)進(jìn)行多維度、多層次分析,嘗試建立各類數(shù)據(jù)分析模型和方法體系,為全覆蓋、常態(tài)化的延續(xù)審計(jì)打下堅(jiān)實(shí)基礎(chǔ);通過建立被審計(jì)單位違規(guī)行為庫,為構(gòu)建審計(jì)數(shù)據(jù)分析模型和審計(jì)方法體系提供審計(jì)實(shí)務(wù)的支撐。四是推動(dòng)大數(shù)據(jù)分析的更廣泛應(yīng)用。一方面,鼓勵(lì)、督促審計(jì)人員直接利用平臺(tái)數(shù)據(jù)分析功能開展分析,改變以往直接使用數(shù)據(jù)庫工具分析數(shù)據(jù)的慣性思維,逐步建立起規(guī)范的數(shù)據(jù)權(quán)限控制、數(shù)據(jù)安全管理、審計(jì)行為控制等“大數(shù)據(jù)”環(huán)境下的審計(jì)工作機(jī)制和行為習(xí)慣;另一方面,培養(yǎng)審計(jì)人員平臺(tái)應(yīng)用的興趣和信心,將審計(jì)人員平臺(tái)應(yīng)用中發(fā)現(xiàn)的問題進(jìn)行分類,評(píng)估其緊急程度,按輕重緩急及時(shí)解決,避免對(duì)審計(jì)時(shí)間產(chǎn)生不良影響,使審計(jì)人員產(chǎn)生不滿情緒和畏難情緒。
總的分兩種:
1 列表法
將實(shí)驗(yàn)數(shù)據(jù)按一定規(guī)律用列表方式表達(dá)出來是記錄和處理實(shí)驗(yàn)數(shù)據(jù)最常用的方法。表格的設(shè)計(jì)要求對(duì)應(yīng)關(guān)系清楚、簡單明了、有利于發(fā)現(xiàn)相關(guān)量之間的物理關(guān)系;此外還要求在標(biāo)題欄中注明物理量名稱、符號(hào)、數(shù)量級(jí)和單位等;根據(jù)需要還可以列出除原始數(shù)據(jù)以外的計(jì)算欄目和統(tǒng)計(jì)欄目等。最后還要求寫明表格名稱、主要測(cè)量儀器的型號(hào)、量程和準(zhǔn)確度等級(jí)、有關(guān)環(huán)境條件參數(shù)如溫度、濕度等。
2 作圖法
作圖法可以最醒目地表達(dá)物理量間的變化關(guān)系。從圖線上還可以簡便求出實(shí)驗(yàn)需要的某些結(jié)果(如直線的斜率和截距值等),讀出沒有進(jìn)行觀測(cè)的對(duì)應(yīng)點(diǎn)(內(nèi)插法),或在一定條件下從圖線的延伸部分讀到測(cè)量范圍以外的對(duì)應(yīng)點(diǎn)(外推法)。此外,還可以把某些復(fù)雜的函數(shù)關(guān)系,通過一定的變換用直線圖表示出來。例如半導(dǎo)體熱敏電阻的電阻與溫度關(guān)系為,取對(duì)數(shù)后得到,若用半對(duì)數(shù)坐標(biāo)紙,以lgR為縱軸,以1/T為橫軸畫圖,則為一條直線。
《中國注冊(cè)會(huì)計(jì)師審計(jì)準(zhǔn)則第1301號(hào)——審計(jì)證據(jù)》,將審計(jì)技術(shù)方法定義和規(guī)定為以下八個(gè)方面。
(一)檢查記錄或文件。
檢查記錄或文件是指注冊(cè)會(huì)計(jì)師對(duì)被審計(jì)單位內(nèi)部或外部生成的,以紙質(zhì)、電子或其他介質(zhì)形式存在的記錄或文件進(jìn)行審查。
檢查記錄或文件包括注冊(cè)會(huì)計(jì)師對(duì)會(huì)計(jì)記錄和其他書面文件可靠程度的審閱與復(fù)核。審閱是為了發(fā)現(xiàn)有無不正?,F(xiàn)象而批判性地閱讀書面資料的審計(jì)技術(shù),其目的在于確認(rèn)書面文件是否真實(shí)、合法;復(fù)核是確認(rèn)各種書面文件之間鉤稽關(guān)系的審計(jì)技術(shù),通過書面文件之間的對(duì)照檢查,確認(rèn)雙方對(duì)交易或事項(xiàng)的記錄是否一致、計(jì)算是否正確。
(二)檢查有形資產(chǎn)。
檢查有形資產(chǎn)是指注冊(cè)會(huì)計(jì)師對(duì)資產(chǎn)實(shí)物進(jìn)行審查。運(yùn)用這種方法的目的在于確定被審計(jì)單位實(shí)物形態(tài)的資產(chǎn)是否真實(shí)存在并且與賬面數(shù)量相符,查明有無短缺、毀損及其他舞弊行為。它主要適用于存貨和現(xiàn)金的檢查,也適用于有價(jià)證券、應(yīng)收票據(jù)和固定資產(chǎn)等。監(jiān)盤是其常用的操作技術(shù)。
(三)觀察。
觀察是指注冊(cè)會(huì)計(jì)師察看相關(guān)人員正在從事的活動(dòng)或執(zhí)行的程序。注冊(cè)會(huì)計(jì)師按照審計(jì)具體目標(biāo)的要求,前往被審計(jì)單位的工作現(xiàn)場(chǎng),察看業(yè)務(wù)活動(dòng)的方法、程序及實(shí)施情況,以掌握整個(gè)業(yè)務(wù)活動(dòng)或執(zhí)行程序的實(shí)際情況,獲取審計(jì)證據(jù)。
(四)詢問。
詢問是指注冊(cè)會(huì)計(jì)師以書面或口頭方式,向被審計(jì)單位內(nèi)部或外部的知情人員獲取財(cái)務(wù)信息和非財(cái)務(wù)信息,并對(duì)答復(fù)進(jìn)行評(píng)價(jià)的過程。
(五)函證。
函證是指注冊(cè)會(huì)計(jì)師為了獲取影響財(cái)務(wù)報(bào)表或相關(guān)披露認(rèn)定的項(xiàng)目的信息,通過直接來自第三方對(duì)有關(guān)信息和現(xiàn)存狀況的聲明,獲取和評(píng)價(jià)審計(jì)證據(jù)的過程。實(shí)施函證的目的是證實(shí)影響財(cái)務(wù)報(bào)表或相關(guān)披露認(rèn)定的賬戶余額或其他信息,從外部獨(dú)立來源來獲取強(qiáng)有力的審計(jì)證據(jù)。
(六)重新計(jì)算。
重新計(jì)算是指注冊(cè)會(huì)計(jì)師以人工方式或使用計(jì)算機(jī)輔助審計(jì)技術(shù),對(duì)記錄或文件中的數(shù)據(jù)計(jì)算準(zhǔn)確性進(jìn)行核對(duì)。注冊(cè)會(huì)計(jì)師往往需要對(duì)文件或記錄中的數(shù)字大量地實(shí)施重新計(jì)算,以驗(yàn)證其是否正確,獲取必要的審計(jì)證據(jù)。
(七)重新執(zhí)行。
重新執(zhí)行是指注冊(cè)會(huì)計(jì)師以人工方式或使用計(jì)算機(jī)輔助審計(jì)技術(shù),重新獨(dú)立執(zhí)行作為被審計(jì)單位內(nèi)部控制組成部分的程序或控制。實(shí)施重新執(zhí)行可以驗(yàn)證被審計(jì)單位內(nèi)部控制的有效性,獲取內(nèi)部控制是否有效的審計(jì)證據(jù)。
(八)分析程序。
分析程序是指注冊(cè)會(huì)計(jì)師通過研究不同財(cái)務(wù)數(shù)據(jù)之間以及財(cái)務(wù)數(shù)據(jù)與非財(cái)務(wù)數(shù)據(jù)之間的內(nèi)在關(guān)系,對(duì)財(cái)務(wù)信息作出評(píng)價(jià)。分析程序還包括調(diào)查識(shí)別出的、與其他相關(guān)信息不一致或與預(yù)期數(shù)據(jù)嚴(yán)重偏離的波動(dòng)和關(guān)系
對(duì)于審計(jì)部門來說,要利用好大數(shù)據(jù),實(shí)際上就是利用好信息采集的工具,通過對(duì)網(wǎng)上海量信息進(jìn)行帥選,找到有價(jià)值的資料,數(shù)據(jù)。我以Knowlesys系統(tǒng)為典型例子說明問題。
其信息采集主要應(yīng)用到以下方面:
產(chǎn)生您的潛在客戶列表
從您的競(jìng)爭(zhēng)對(duì)手中收集產(chǎn)品價(jià)格信息
抓取新聞文章
建立您自己的產(chǎn)品目錄
整合房地產(chǎn)信息
收集上市公司的財(cái)務(wù)狀況和數(shù)據(jù)
這樣的系統(tǒng),具有以下的好處
1簡單:您不需要使用任何的軟件。只需要告訴我們您需求的是什么和您的目標(biāo)網(wǎng)站是什么,然后就能直接獲取數(shù)據(jù)庫。
2彈性:您能從任何的網(wǎng)站上獲取任何數(shù)據(jù),特別是動(dòng)態(tài)網(wǎng)站上的數(shù)據(jù)。
3快捷:一般您在付款后的24--72小時(shí)內(nèi)就能獲得所需要的數(shù)據(jù)。對(duì)于大量的數(shù)據(jù),我們能在一周或兩周內(nèi)完成。
4精確:抽取結(jié)果的每一列都是您所需要的,不多也不少。我們會(huì)按照您的要求對(duì)數(shù)據(jù)進(jìn)行過濾和校驗(yàn)。
5低廉的價(jià)格:您只需要為您的所需數(shù)據(jù)付款而無需購買貴的機(jī)器和軟件,無需學(xué)習(xí)如何使用軟件,無需把您寶貴的時(shí)間用來運(yùn)行軟件。
聲明:本網(wǎng)站尊重并保護(hù)知識(shí)產(chǎn)權(quán),根據(jù)《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》,如果我們轉(zhuǎn)載的作品侵犯了您的權(quán)利,請(qǐng)?jiān)谝粋€(gè)月內(nèi)通知我們,我們會(huì)及時(shí)刪除。
蜀ICP備2020033479號(hào)-4 Copyright ? 2016 學(xué)習(xí)鳥. 頁面生成時(shí)間:2.975秒