在線客服

數據分析論文實用13篇

引論:我們為您整理了13篇數據分析論文范文,供您借鑒以豐富您的創作。它們是您寫作時的寶貴資源,期望它們能夠激發您的創作靈感,讓您的文章更具深度。

數據分析論文

篇1

2.1SVM算法SVM算法最初是由Vapnik等人在1995年提出的一種可訓練的機器學習算法.依據統計學習理論、VC維理論和結構風險最小化理論,從一定數目的樣本信息在學習能力和復雜度(對訓練樣本的學習程度)中找到最佳折中,以期望獲得最好的推廣能力(或稱泛化能力).

2.2基于SVM的醫療數據分析模塊將SVM分類算法應用到醫療數據分析模塊中,進行疾病預測.基于SVM的醫療數據分析模塊,通過數據交換模塊獲取原始組數據(患病病人醫療數據和對照組病人數據).通過特征選擇過程輸入到SVM分類器中進行訓練,訓練后可以對新的醫療數據進行分析預測.

3改進的醫療數據交換模塊

3.1醫療數據交換模塊在原始的醫療數據交換模塊中,數據請求原語只由4條通信原語組成.由原始醫療數據分析模型的3個模塊構建,其中在醫療數據分析模塊與醫療數據提取模塊之間的4條通信原語包括2條請求和2條應答.由于醫療數據的維度極大,屬性很多,但是在預測某個疾病時,只有很少的一部分屬性會對分類預測產生影響.這樣的全部維度的數據都需要傳輸,浪費了時間,降低了數據傳輸效率,影響了醫療數據分析模塊的算法效率.

3.2改進的醫療數據交換模塊在改進的醫療數據交換模塊中,在數據傳輸協議中增加了4條原語.在每條原語中不僅有醫療記錄條數的要求,還包括對所請求醫療數據維度和屬性的具體說明.醫療數據分析模塊先請求一小部分全部維度的數據,對這小部分數據進行特征選擇.然后醫療數據分析模塊只請求特征選擇出來的對預測相關的屬性的剩余所有醫療數據.最后通過SVM分類算法進行訓練和預測.在新的醫療數據交換模塊中,大部分數據中只有小部分相關屬性被傳輸到數據分析模塊,極大地減少了數據傳輸總量,也同時增加了分析模塊預測算法的效率.

篇2

大數據時代,大數據有著來源復雜、體量巨大、價值潛伏等特點,這使得大數據分析必然要依托計算機技術予以實現.因此從兩個方向上加強數據采集統建設,一是側重于數據的處理與表示,強調采集、存取、加工和可視化數據的方法;二是研究數據的統計規律,側重于對微觀數據本質特征的提取和模式發現,在兩個方向上的協同、均衡推進,以此來保障大數據平臺應用的穩健成長和可持續發展.廣電的網絡和用戶是其核心資產,而其中流動的數據(包括用戶基礎數據、網絡數據、網管/日志數據、用戶位置數據、終端信息等)是核心數據資產.對于廣電運營商來說,最有價值的數據來自基礎網絡,對于基礎網絡數據的挖掘和分析是運營商大數據挖掘的最重要方向.因此其數據采集的目標包括機頂盒數據、CRM數據、帳務數據、客服數據、運維數據、媒資數據、GIS數據、財務數據和其他手工錄入、表格數據.采集頻率要求可以實現實時采集和定時批量采集.采集這類數據帶來一個問題就是各類數據雜亂無章,會導致數據質量問題越來越嚴重,通過引進實時質量監控和清洗技術,建設強大的分布式計算和集群能力,提高數據監控和數據采集性能,利用分布式處理技術,實現數據抽取、數據清洗以及相應的數據質量檢查工作,保證采集到高質量的數據,將廣電大數據中心建設成一個覆蓋廣電系統全部數據的存儲中心,具備采集各類結構化、非結構化海量數據的處理能力.

1.2數據分析中心

廣電企業每時每刻都在產生大量的數據,需要對這些數據歸集、提煉,廣電企業大數據平臺建設的意義在于有效掌握規模龐大的數據信息,對這些數據信息進行智能處理,從中分析和挖掘出有價值的信息.在廣電大數據分析中需要對直播節目分析、互動業務分析、互聯網流量分析、互聯網內容分析、廣電客戶分析、市場收益分析、智能內容推送和廣告分析等,通過這類數據分析,能夠實時了解廣電運營商的經營狀況,提供決策支持.因此采用兩種方式分析方法對收集到的數據進行分析處理.一是采用在線分析方法技術,使分析人員能夠迅速、一致、交互地從各個方面觀察信息,以達到深入理解數據的目的.這些信息是從原始數據直接轉換過來的,他們以用戶容易理解的方式反映企業的真實情況.在線分析策略是將關系型的或普通的數據進行多維數據存貯,以便于進行分析,從而達到在線分析處理的目的.這種多維數據存儲可以被看作一個超立方體,沿著各個維方向存貯數據,它允許分析人員沿事物的軸線方便地分析數據,分析形式一般有切片和切塊以及下鉆、挖掘等操作.二是數據挖掘是從海量、不完全的、有噪聲的數據中挖據出隱含的、未知的、用戶可能感興趣的和對決策有潛在價值的知識和規則.這些規則蘊含了數據庫中一組對象之間的特定關系,揭示出一些有用的信息,可以為經營決策、市場策劃和金融預測等方面提供依據.

1.3數據應用中心

在大數據分析平臺應用過程中,數據本身并不是數據分析和數據挖掘的重點,重點在于如何應用這些技術去解決企業在運營中實際的商業問題.通過對數據分析和挖掘,了解企業運行過程存在問題,預判企業中各類業務發展走向.對數據分析與挖掘結果來說主要有兩個方面,一是將分析結果給客戶使用,另一個是將分析結果提供給內部用戶使用,因此在大數據分析平臺設計中,將數據應用劃分為三個應用中心:

1)推薦中心

推薦中心面向收視、寬帶使用用戶,通過分析使用用戶的收視、互聯網、消費等行為,將使用用戶分群,總結群體特征,向不同群體推薦個性化的電視節目、廣告和增值應用服務.從而提升用戶的使用體驗,提升用戶的滿意度和粘度.

2)決策中心

決策中心面向廣電企業內部決策者、管理者、經營分析人員,通過對企業經營數據的KPI、運營監控、經營盤點,使企業決策者掌握企業運營狀況及發展趨勢;智能報告協助分析人員自動定位經營中的問題;即席查詢在預定義的語義層基礎上,實現靈活的自定義查詢;通過主題分析滿足各部門、崗位的多維度分析需求;通過專題分析就某一具體問題進行深入挖掘,輔助專業分析人員的工作;統計報表滿足各部門常規統計需求.

3)服務中心

服務中心面向廣電的合作伙伴,比如:電視臺、廣告商、服務和內容提供商、相關政府職能部門等.通過對使用用戶收視行為的實時分析,將電視欄目實時收視率提供給電視臺,電視臺根據收視率進行在線的問卷調查,提高電視臺的影響力,幫助其增強欄目的評價體系.為廣告商提供精準的廣告投放策略,實時準確的廣告投放評估,幫助廣告商提升廣告到達率、準確度和營銷效果.為服務和內容提供商的電影、電視和增值應用等產品提升收視率和使用頻率,并進行評估,為其提供受眾喜好特征,幫助其推出有針對性的產品.通過用戶收視數據、節目反饋等信息,將相關輿情向相關政府部門匯報.

1.4系統管理

系統管理是大數據分析平臺一個輔助功能模塊,主要是為了系統管理員對大數據平臺進行有效的監控和管理,提升大數據分析平臺性能使用,包含有如下幾個模塊:權限管理、數據質量管理、元數據管理、調度管理、系統監控等.

2數據應用分析

移動互聯網的發展為傳統行業帶來了新的思考,如何在互聯網時代更好地實現以客戶為中心的服務理念,借助大數據分析平臺、海量的客戶非結構化的行為數據和傳統的結構化數據,可以有效提升廣電個性化、人性化的服務水平.大數據分析平臺通過整合廣電網絡中多個數據源,并按照主題進行劃分,在定義主題的過程中,提供廣電業務概念的規范定義.數據模型不偏重于面向某個應用,而是站在企業角度統攬全局,提供可擴展的模型設計,偏范式化的設計使平臺在最大程度上保持一致和靈活擴展性.依托某廣電網絡公司業務開展情況,搭建數據分析平臺,具有如圖2所示的主題結構,共計8大類53小類,從廣電網絡運營的各個方面進行了數據分析.

2.1直播節目分析主題

直播電視節目作為廣電運營模式中一直沿用的產品類型,對于廣電用戶的影響和廣電運營商運營模式起著至關重要的作用.實時直播節目分析,用戶可以實時查看每個時間點上每個節目收視率,以此為據來指導產品定制、節目選擇、用戶推廣等方面的商業應用,對直播節目的多維度分析,運營商可深入分析直播節目收視特性及受眾影響規律,以指導運營優化,提高節目的收視率和營收.

2.2多媒體業務分析主題

廣電行業的雙向網絡改造不僅將視頻點播、通信及娛樂業務成為可能,同時配備增值業務,如廣告、支付、股票、游戲、付費節目等服務.可以明顯看到哪類業務最受歡迎,哪類業務的增長趨勢良好,哪類業務應用下滑得較快,哪類業務不受用戶歡迎,從這樣的分析結果中,可以為廣電網絡以后的業務引進中提供指導,避免引進的業務不受用戶歡迎,同時也可以預見性的引進一些代表將來趨勢性的業務,提前做好業務儲備工作.互動業務的互動特性為廣電運營商增加客戶粘度、制定產品投放策略、獲取最大化收益及市場價值提供了前所未有的空間,通過對互動業務的應用分析,可以分析出用戶的行為趨勢.利用這樣的分析結果改善廣電業務引進,提高用戶的粘度和ARPU值.

2.3互聯網應用分析主題

廣電作為政府宣傳的喉舌,一個主要的特點就是可管可控,相對此而言,互聯網網絡一個重要特點就是用戶各類行為的不可控性.在三網融合的新環境下,廣電網絡一個重大改變就是引進了互聯網業務,同時通過多屏互動技術使廣電終端類型日益復雜,如何對廣電網絡引進的互聯網業務和終端進行有效的管控,成為擺在廣電網絡運營商面前一個重要課題.運營商可以清晰地看到用戶在討論什么、在看什么,以此來分析用戶將來可能采取的行為趨勢,進而來引導用戶輿論與行為,實現對廣電網絡的可管可控的最終目的.同時廣電網絡也可以利用互聯網數據從如下兩方面做了分析,運營流量及應用優化,節省網絡帶寬,減少運營費,同時用以提高用戶體驗度,增加用戶粘性;充分利用線上、線下同步運營模式,深入挖掘線上討論內容,為線下運營提供指導.

2.4廣電客戶分析主題

在三網融合的環境下,廣電網絡在逐漸擺脫事業單位模式下經營模式,向“市場驅動”、“客戶驅動”經營模式的轉變,“以客戶為中心”的理念和策略不可或缺,而廣電網絡擁有的客戶群和常規用戶分析的客戶群體有著本質區別,以往分析往往針對個體用戶進行分析,廣電網絡面向的用戶通常是以家庭為單位的,這給廣電網絡用戶行為分析帶來不可預料的困難.通過針對用戶群體不同年齡、不同時間段的收視行為和上網行為分析,可以區分某一時間段內該家庭用戶內個人的行為,可以清晰看到各類用戶在各個階段的變化情況,以及這個變化給廣電網絡運營帶來的變化.從用戶信息出發,以用戶應用行為為主線,深入挖掘用戶關系,為廣電用戶關系管理提供有效基礎數據,提高用戶滿意度、忠誠度,提高廣電網絡市場運作的主動性.

2.5市場收益分析主題

三網融合后,廣電網絡作為一個市場主體,需要適應日趨激烈的市場競爭環境,提升廣電運營商的企業核心競爭力,應充分利用業務支撐系統產生的大量寶貴的數據資源,建立廣電企業收益分析系統,實現對收益數據的智能化加工和處理,為市場運營工作提供及時、準確、科學的決策依據.利用先進的OLAP技術和數據挖掘技術,幫助企業的經營決策層了解企業經營的現狀,發現企業運營的優勢和劣勢,預測未來趨勢;幫助細分市場和客戶,指導營銷、客服部門進行有針對性的營銷和高效的客戶關系管理;對決策的執行情況和結果進行客觀準確的評估,深受用戶的青睞.如圖7所示的收益分析結果,可以清晰看出企業各類業務在營收中所占比例,可以明確了解哪類業務是企業的優質業務,哪類業務需要進一步加強開拓市場,同時也可以預測哪類業務會有更大的推廣空間,為企業持續開展業務提供指導.

2.6智能內容推送主題

深層次挖掘用戶潛在的需求,以用戶的需求為導向,向用戶推送有針對性的內容.廣電運營商通過對用戶差異性的運營策略,激發用戶參與的熱情,讓用戶有持續的良好體驗,提升對用戶的吸引力和黏著度.信息精準、智能推送的關鍵在于把握住用戶的行為習慣,同時讓每一個用戶都可以按自己需求方便、快捷地調整、歸類相關信息.大數據分析平臺基于用戶行為收集分析系統,挖掘出用戶潛在需求,充分了解了用戶的真實意愿,將有助于廣電運營商建立以客戶為中心的服務理念,提升社會影響力.

篇3

1.2數據預處理

數據采集的過程本身就有會有很多數據庫,但如果想達到有效分析海量數據的目的,就必將這些來自前端的數據導入到一個集中的大型分布式數據庫,或者分布式存儲集群,而且在導入基礎上做一些簡單的辨析、抽取、清洗等操作。

①抽取:因為我們通過各種途徑獲取的數據可能存在多種結構和類型,而數據抽取過程可以有效地將這些復雜的數據轉換為單一的結構或者便于處理的類型。以達到快速分析處理的目的。

②清洗:對于海量數據而言,數據所處的價值層次不一樣,就必然存在由于價值低而導致開發成本偏大的數據,還有與數據分析毫無關系的數據,而另一些數據則是完全錯誤的干擾項,所以對數據通過過濾“去噪”從而提取出有效數據是十分重要的步驟。

1.3數據的存儲與管理

當我們采集數據完成后,就需要將其存儲起來統一管理,主要途徑就是建立相應的數據庫,進行統一管理和調用。在此基礎上,需要解決大數據的可存儲、可表示、可處理、可靠性及有效傳輸等幾個關鍵問題。還需開發可靠的分布式文件系統(DFS)、能效優化的存儲、計算融入存儲、數據的去冗余及高效低成本的大數據存儲技術;以及分布式非關系型大數據管理與處理技術、異構數據的數據融合技術、數據組織技術、研究大數據建模技術、索引、移動、備份、復制、可視化技術。

1.4數據的統計分析

一般情況下,統計與分析主要就是利用分布式數據庫,或者分布式計算集群來對存儲于其內的海量數據進行普通的分析和分類匯總等,以滿足大多數常見的分析需求,在這方面,一些實時性需求會用到EMC的GreenPlum、Oracle的Exadata,以及基于MySQL的列式存儲Infobright等,而一些批處理,或者基于半結構化數據的需求可以使用Hadoop。統計與分析這部分的主要特點和挑戰是分析涉及的數據量大,其對系統資源,特別是I/O會有極大的占用。

1.5數據分析與挖掘

所謂數據挖掘是指從數據庫中的大量不完全的、有噪聲的、模糊的、隨機的實際應用數據中,揭示出隱含的、先前未知的并有潛在價值的信息的過程。與前面統計和分析過程不同的是,數據挖掘一般不會有預先設計好的主題,主要是在現有數據上面進行基于各種算法的計算,從而起到預測(Predict)的效果,從而實現一些高級別數據分析的需求。比較典型的算法有用于聚類的K-means、用于統計學習的SVM和用于分類的NaiveBayes,主要使用的工具有Hadoop的Mahout等。該過程的特點和挑戰主要是用于挖掘的算法很復雜,并且計算涉及的數據量和計算量都很大,常用數據挖掘算法都以單線程為主。

2數據分析的8個層次

2.1標準化報告(StandardReports)

標準化報告作為數據分析的第一個層次,要求相對較低,主要是借助相應的統計工具對數據進行歸納總結,得出包含主要參數指標的標準化報告。類似于一個銷售企業每月或者每季度的財務報表。

2.2即席查詢(AdHocReports)

用戶可以通過自己的需求,靈活地選擇查詢條件,系統就能夠根據用戶的需求選擇生成相應的統計報表。即席查詢與普通應用查詢最大的不同是普通的應用查詢是定制開發的,而即席查詢所有的查詢條件都是用戶自己定義的。在面向高層的數據分析軟件中,用戶隨意添加想要查詢的指標按鈕再加上相應的限制條件,就可以立即生成可視化的統計結果,不僅一目了然,而且沒有任何操作難度。

2.3多維分析(QueryDrilldown)

多維分析是指對具有多個維度和指標所組成的數據模型進行的可視化分析手段的統稱,常用的分析方式包括:下鉆、上卷、切片(切塊)、旋轉等各種分析操作。以便剖析數據,使分析者、決策者能從多個角度多個側面觀察數據,從而深入了解包含在數據中的信息和內涵。上卷是在數據立方體中執行聚集操作,通過在維級別中上升或通過消除某個或某些維來觀察更概括的數據。上卷的另外一種情況是通過消除一個或者多個維來觀察更加概括的數據。下鉆是在維級別中下降或者通過引入某個或者某些維來更細致地觀察數據。切片是在給定的數據立方體一個維上進行的選擇操作,切片的結果是得到了一個二維的平面數據(切塊是在給定的數據立方體的兩個或者多個維上進行選擇操作,而切塊的結果是得到了一個子立方塊)。轉軸相對比較簡單,就是改變維的方向。

2.4儀表盤與模擬分析(Alerts)

儀表盤用于監控一些關鍵指標。模擬分析是由操作者動態地加以調節的控件(如滑動塊、可調旋鈕、選擇框等),來控制管理決策模型行為某些參數。當操作者通過控制面板對模型中的參數值或變量值進行調節時,圖形中的曲線、柱形組或分析指標等要素就會發生相應的運動,而這種運動正好反映了該參數的變化對模型行為的影響,如果這種變動引起了模型中最優解或其他關鍵數字的變化,能夠隨時將關于這種變化的結論正確地顯示出來。

2.5統計分析(StatisticallyAnalysis)

我們知道概率論是數理統計的基礎,數理統計是在其基礎上研究隨機變量,并應用概率論的知識做出合理的估計、推斷與預測。概率論中討論的各種分布在數理統計中作為統計模型來分析處理帶有隨機誤差的數據。典型的數理統計方法有參數估計、假設檢驗和回歸分析。而統計分析主要是對用戶所關注的問題進行推斷、預測和控制的分析方法。具體可以分為以下三方面:

①描述統計:主要是集中趨勢、離散程度、分布形狀等,統計圖(方圖、箱線圖、散點圖等);

②數據的分類匯總;

③基礎統計分析:方差分析、時間序列分析、相關和回歸分析、(主成分)因子分析等統計分析方法。

2.6預測(Forecasting)

在統計分析和數據挖掘領域,對未來的預測已經有了很多數學模型以及解決具體問題的相關算法。其核心思想便是從歷史數據中找出數據的發展模式,然后以這些模式為支點,就可以對未來進行預測。

2.7預測模型(PredictiveModeling)

隨著數據分析學家對數據挖掘技術的不斷探索,出現了很多預測模型以及與之相對應的算法,但是很難確定某個模型是最精確的,因為不同的領域,不同的條件,對應的預測模型是不一樣的,所以沒有統一化的最優模型,只存在有選擇性的最優模型。下面介紹幾種典型的預測模型。

①回歸模型:回歸模型可以分為一元線性回歸模型和多元線性回歸模型。一元線性回歸模型可表示為yt=b0+b1xt+ut,該式表示變量yt和xt之間的真實關系。其中yt稱作被解釋變量(或相依變量、因變量),xt稱作解釋變量(或獨立變量、自變量),ut稱作隨機誤差項,b0稱作常數項(截距項),b1稱作回歸系數。b0+b1xt是非隨機部分,ut是隨機部分。而在很多情況下,回歸模型必包含兩個或更多自變量才能夠適應地描述經濟現象各相關量之間的聯系,這就是多元線性回歸模型需要解決的問題,其一般形式為:Y=a+b1X1+b2X2+…+bmXm,式中X1、X2、…、Xm是這個多元回歸問題的m個自變量,b1、b2、…、bm是回歸方程對應于各自變量的系數,又稱偏回歸系數。

②貝葉斯網絡:貝葉斯網絡是基于概率推理的數學模型,而概率推理是通過一些產量的信息來獲取其他概率信息的過程。貝葉斯網絡會建立一個有向無環圖和一個概率表集合,有向無環圖中的每一個節點便是一個隨機變量,而有向邊表示隨機變量間的條件依賴,條件概率表中的每一個元素對應有向無環圖中唯一的節點,存儲此節點對其所有直接前驅節點的條件概率。貝葉斯網絡是為了解決不定性與不完整性問題而提出的,在多個領域中獲得廣泛應用。

③基于時間序列分析的指數平滑模型在時間序列分析中指數平滑模型是最靈活和準確的方法,在經濟領域也被證明是最有效的預測模型。在不同的時間序列下,指數平滑模型可以分為簡單指數平滑法、帶有趨勢調整的指數平滑法、帶有阻尼趨勢的指數平滑法、簡單季節指數平滑法、帶有趨勢和季節調整的指數平滑法五種不復雜度的模型。

2.8最優化

(Optimization)因為優化問題往往可以帶來巨額的收益,通過一系列可行的優化,可以使收益得到顯著提高。所謂最優化就是從有限或者無限種可行的方案中選取最優的方案。如果可以通過簡單的評判,就可以確定最優方案那是最好的。但是事實不會那么簡單,所以優化技術已經發展出了一系列的理論來解決實際問題。其常用的優化技術為:

①線性規劃:當目標函數與約束函數都是線性函數時,就是一個線性規劃問題。而當同時滿足約束函數和目標函數時,則可以認為是最優解。

②整數規劃:要求決策變量取整數值的數學規劃。

③多目標規劃:指衡量一個決策優劣的標準不止一個,也就是有多目標函數。

④動態規劃:將一個復雜的問題劃分為多個階段,逐段求解,最終求出全局最優解。

3用Excel實現簡單的數據分析

①對于企業而言最重要的是利潤,所以管理者必須要從這張表中得到最關鍵也最容易得到的銷量和銷售額以及與其相關的一些數據,通常是用最基本的數理統計結果來直觀地反映該企業在某個期間的盈利情況。

②其次,我們必須要做進一步的分析。已經對整體的情況有了一定的把握,所以就可以朝著不同的方向去挖掘一些有價值的信息,為企業高層做決策提供有力的依據。對產品銷售而言,客戶結構能夠有效地反映客戶的地域分布,企業可以根據客戶的來源,在未開辟客戶的地域去尋找新的目標客戶群。而銷量結構可以直觀地反映企業最大銷量來自哪個地區,對銷量較小的地區可以加大宣傳力度或者增加銷售網點來保持各地區銷售均衡。還可以及時地調整銷售方式來擴大市場份額,而對于銷量最小的地區考慮開辟新的市場。

統計了各地區的銷售總額和平均銷售額以及兩者的對比關系。由此可以得出地區平均購買力大小,以及各地區總銷售額大小。借助圖表描述,管理者可以對企業在某段期間內的銷售狀況有一個大概的把握,只有掌握了這些的信息,才能更細化地去研究具體的影響因素。劃分等級,對于經常性大量購買的客戶必須要以最優惠的價格和最好的服務讓其滿意,以形成一個穩定的大客戶群。而對于那些少量購買的客戶,也要制定出相應合適的方案來留住客戶。所以,分析銷售額的分布情況,可以掌握客戶的購買力度而且還能及時做一些留住大客戶的舉措。

4用R語言實現數據多層次分析

R語言是一種自由軟件編程語言與操作環境,是一套完整的數據處理、計算和制圖軟件系統,它是一種用來進行數據探索、統計分析和作圖的解釋型語言。它可以提供一些集成的統計工具,但更大量的是它提供各種數學計算、統計計算的函數,從而使使用者能靈活機動地進行數據分析,甚至創造出符合需要的新的統計計算方法。而在使用R語言進行數據分析處理時,當我們遇到很大的原始數據,但用來建模的數據較小,則可以先在數據庫中進行整理,然后通過R與數據庫的接口提取數據,數據庫適合存放和整理比較規整的數據,和R中的數據框有良好的對應關系,這也是R中絕大多數統計模型的標準數據結構。數據庫中大部分的運算都不需要消耗很大的內存。

篇4

(三)面板回歸

1.財稅政策改革對經濟發展的整體效應。研究財政分權對GDP的影響,本文參考黃顯林發表于2013年的《財稅政策演進對地區產業結構發展水平的影響研究--基于分權背景下的省級面板數據分析》中的研究方法,以GDP為被解釋變量,R、EDU、GYH、F為解釋變量,建立如下回歸模型:本文同時采取面板數據的固定效應模型和隨機效應模型進行回歸分析,同時應用Eviews6.0采用廣義最小二乘法(GLS)對模型進行估計,以免去對模型進行異方差檢驗,然后通過F檢驗和Hausman檢驗為各個樣本組選擇混合OLS模型,或固定效應模型,或隨機效應模型。面板回歸模型選擇F檢驗的P值為0.0000,拒絕原假設,可認為應該建立固定效應回歸模型,同時Hausman檢驗結果對應的P值也為0.0000,拒絕原假設,也認為應該建立固定效應回歸模型,因此2007~2012年31個省市的年度數據應該建立個體固定效應模型。固定效應模型結果表明,回歸方程整體顯著(F=2470.712,P=0.000000<0.01),各回歸系數在0.05顯著性水平下均顯著不為0,調整后的樣本決定系數為0.997802,模型擬合得非常好。EDU對GDP的影響最大,R、F次之,GYH最小。同時,R、EDU和F對GDP均有顯著的正向影響,其系數分別為0.350122、0.484144、0.066664,說明財稅分權、教育支出水平、稅收水平等都促進了經濟的發展。而GYH的系數為-0.041997,這說明工業化進程對經濟的發展有輕微的反向作用,這說明工業化進程的加大并沒有強烈促進經濟的發展。

2.財稅政策改革對經濟發展的區域差異效應。由于地方的經濟水平、人力物力資源等的差異,具體財稅政策改革對地方經濟發展的影響效應可能會存在明顯的地區差異。因此有必要通過建立變系數模型來分析財稅分權對經濟發展的地區差異效應。使用Eviews6軟件分別對本文的面板數據進行變系數、變截距、不變系數模型的估計,得到殘差平方和,通過建立協方差分析,構建F統計量的方法來判別。根據變異系數模型估計出31個省市的結果,在10%置信水平下,相關變量系數大部分都通過顯著性檢驗,模型擬合程度很高。

二、結論及相關政策建議

(一)財稅分權促進地區經濟增長。中國財稅分權水平對地區經濟增長具有明顯的促進作用。在今后的財稅體制的進一步改革中,地方政府應該向中央爭取更大的財稅政策權力空間。根據樓繼偉《中國政府間財政關系再思考》一書,下一步應按外部性、信息復雜程度、激勵相容三原則劃分政府間事權,逐步理順政府間財權--事權關系,即財政權力--財政義務的關系,特別是要把區域性公共服務作為地方事權,并要把區域性公共服務的責任交由地方政府負責承擔。

(二)各地區應因地制宜的改善本地區的財政分權水平的財政支出項目。影響各地區經濟發展的因素存在明顯的地區差異效應,各地區應該根據自身的情況,有針對性的改善本地區財政分權水平和財政支出項目。如在通過本文的面板分析可知:部分地區教育水平系數基本為正,這說明地區教育程度對地區經濟發展的影響基本上呈現正向相關關系。

篇5

2.1固網用戶數據的組成和結構

對于企業來說,大量的用戶數據不僅有利于客戶關系管理(CRM),同時也是獲得用戶知識的源泉。從用戶知識發現的過程中可以看到,用戶數據的質量會對知識發現的結果產生直接的影響,所以用戶數據準備也是一項很重要的步驟。從商業系統中提取出高質量的用戶數據就成為一項最主要的工作。固網企業的用戶數據包括用戶基本信息、用戶賬單信息以及客服信息。數據倉庫就是根據這種方式來組織的。

2.2知識發現的方法和過程

用戶知識發現概括如下:根據提出的商業目標,分析大量的用戶數據,找出隱藏的和未知的規律或者豐富已知的規律,進而提出模型;最后要將數據挖掘和分析的結果轉化成有商業意義的方法,然后采取進一步的行動。用戶知識發現必須遵循以下幾個步驟:商業理解,數據理解,數據準備,分類模型,評估應用。

2.3數據挖掘建立用戶分類模型

近年來,“以客戶為中心”的電信市場開始強調為不同用戶提供個性化服務,其前提條件就是用戶分類。這也說明了過去的消費行為也預示了未來的消費傾向。

(1)商業理解

對用戶的理解不僅是理解電信市場的開始,也是理解客戶關系管理的開始。在電信企業中對用戶的理解包括:用戶種類,不同類中用戶的本質屬性區別,用戶偏好,不同類別之間的用戶如何通信等。

(2)用戶數據準備

對用戶分類的研究主要是從用戶屬性中得到用戶特征和行為習慣。主要數據來源于用戶賬單信息,同時也需要從商業系統中得到一些用戶的基本屬性信息。

(3)用戶分類模型

本文使用聚類分析對用戶進行細分以建立分類模型。聚類分析是把大量數據點的集合根據最大化類內相似性、最小化類間相似性的原則進行聚類或分組,使得每個類中的數據之間最大限度地相似、而不同類中的數據之間最大限度地不同。

3固網漏話用戶數據分析

3.1關于固網漏話用戶數據分析的商業理解

通過各種渠道調查,對固網漏話用戶數據分析的目標可以概括為以下幾點:

(1)對用戶通話次數、時間段等分析,找出特征,以此來尋找目標用戶;

(2)對用戶開通漏話保護業務前后的ARPU值分析比較,分析收益的對比;

(3)對目標用戶數據分析,從用戶分類的角度來管理,設計針對性的服務,提升用戶滿意度。

3.2系統用戶數據準備

數據準備的過程:明確目標;制定計劃;分析變量的獲??;數據收集和獲??;數據集成。根據當前客戶關系管理基本狀況和數據挖掘的目的,涉及到的人口屬性變量有:性別、年齡、住址、用戶職業、婚否、學歷、薪資等。用戶分類結束之后,再使用描述變量來進行分析說明。本文選用某市電信公司運營支持系統和經營分析系統的數據,從中選取了基本客戶基本信息表、客戶詳細話表、賬單及繳費信息表、產品信息表、業務使用清單等原始數據。數據挖掘工具選擇SPSSClementine。在使用該工具進行挖掘之前,需要對數據進行清洗:

(1)刪掉不滿足要求的數據:選擇普通的用戶;選擇狀態正常的用戶;選擇入網時間較長的用戶,使數據有完整的用戶周期;

(2)去掉異常數據:比如用于測試的號碼;

(3)去掉極端值:不具備普遍性的極值容易產生噪聲。

3.3固網漏話用戶數據分析結果

考慮到不同分類建立的有效性和簡便性,以及固話用戶和數據源的特點,本文采用常見的K-means算法,其高可靠性、高精準性以及低復雜度使其成為主流的聚類算法。本文選用SPSSClementine作為數據挖掘工具進行K-means聚類分析。獲取原始數據并進行預處理之后,選擇參與聚類的細分變量,輸入簇的個數k,選擇k=7,然后點擊“聚類”按鈕,使用K-means算法對固網漏話用戶數據進行聚類。經過正常值選擇、極值處理等一系列的數據清洗工作,最后用于研究的記錄有251284條。

3.4分析結果和解釋

93%的遇忙話務都出現在8∶00~18∶00的工作時段,這說明該時段遇忙話務較多,話務量流失嚴重,特別需要遇忙話務的解決方法。而這一時間段遇忙話務量最多的就是政企用戶,這些話務量流失對政企用戶將造成巨大的損失:30000政企用戶一個月遇忙話務損失達到260萬次,本網超過120萬次,每個月預計損失20萬;以電信中等發達省份為例:符合條件的政企高端用戶約為60萬;每年度損失的潛在業務收入為50000萬。經過分析,得到該市各地區已開通和未開通漏話保護業務的用戶分布,如圖4所示。C區屬于政務新區,未開通漏話業務的用戶較多,而F區屬于工業園區,企業較多,很多用戶已開通漏話保護業務,但是還有大量用戶未開通該業務,所以C區和F區應該作為該業務的重點推廣地區。綜上分析,固網漏話業務是一個非常有潛力的業務,解決漏話問題是提高用戶滿意度和忠誠度的重要途徑。根據上文的分析,在8∶00~18∶00時間段,用戶遇忙話務量非常多,在這段時間內,企業需要更多的漏話接入服務器,而在其他時間段可以減少接入服務器以節約成本。而在不同的地區,用戶數量和精準用戶的數量也不同,應該選擇精準用戶較為集中的地區優先推廣漏話保護業務。由于精準高端用戶帶來的收益遠遠超過普通用戶,所以要對經過篩選的精準用戶采取針對性措施,比如在C區和F區大力宣傳,以各種形式讓精準客戶看到該業務帶來的收益,還可以電話推廣為精準用戶提供信息。

篇6

普光氣田天然氣凈化廠循環水應急池位于普光氣田天然氣凈化廠一臺地的填挖交界區域,地質狀況復雜。水池平面尺寸110m×50m,深6m(泵區深6.5m),設計有效容積30000m3,主要用于廠內緊急情況下循環水的應急排放。池體結構為鋼筋混凝土,設有一縱五橫6條沉降縫,池體混凝土強度等級為C30、抗滲等級為S6,基礎采用C15毛石混凝土換填,換填深度為3m。

3沉降監測網的布設與施測

3.1沉降監測網的布設為了保證水池蓄水試驗過程中,池體沉降監測的順利進行,需在水池周邊布設一個獨立沉降監測網。沉降監測網布設過程中,考慮到新建沉降監測網基準點自身穩固需要一定的時間跨度和本地區常年多雨的氣候條件限制,在沉降監測網基準點布設時不再重新埋設基準點,而是利用距離水池100m以外的3個廠內原有的、且經過施工期間多次觀測精度可靠的控制點作為本工程水池沉降觀測的基準點。為便于后期對池體進行沉降監測和能夠反映出池體的準確沉降情況,沉降觀測點設在最能反映池體沉降的沉降縫兩側及轉角處。在池底板混凝土澆筑時預先埋設沉降監測點,沉降監測點埋設位置為距池壁外側約50cm的底板上,沉降監測點分布原則為每條沉降縫兩側及轉角處各埋設1個,共計28個。

3.2儀器選擇與施測為了保證水池沉降觀測數據的準確有效,為水池蓄水試驗過程中池體結構安全提供參考依據以及為3個基準點賦予新的獨立高程數值。蓄水試驗前使用蘇州一光EL302A電子水準儀對沉降監測網內的3個基準點,分別按照閉合水準路線和附合水準路線進行多次二等水準測量,其偶然中誤差M和全中誤差MW均小于0.8mm,完全符合二等水準測量的精度要求。

4沉降監測

4.1確定觀測次數

為了取得水池沉降監測的參照數據,水池充水前應進行一次與沉降監測精度(二等)相同的水準測量,以測得的各監測點高程數據為基準,計算蓄水試驗期間各監測點的沉降量。同時,為了保證水池蓄水試驗過程中池體結構安全,避免因水池充水速度過快導致池體失穩垮塌,水池蓄水試驗過程中應緩慢充水。每2m高度或每次充水觀測一次,發生不均勻沉降時應停止充水,并增加觀測次數,直至穩定后再繼續充水;水池蓄水達到設計高度后,觀測一次,24h后觀測一次,連續觀測3d,以后每15d觀測一次,直至沉降穩定;放水前后再各觀測一次。

4.2沉降監測

本工程沉降監測的測量儀器使用蘇州一光EL302A電子水準儀。測量時除了轉角點外,均采用間視法進行觀測。但是,最長視線長度不得大于50m,最短視線長度不得小于3m,最低視線高度不得低于0.6m;觀測讀數應精確到0.01mm,從而達到保證測量精度的目的,以保證沉降監測數據的有效性。

5數據分析

5.1數據處理數學模型

為了保證沉降監測數據計算的準確無誤,在數據計算時利用Excel表格進行[6]。同時,為了充分體現各監測點的沉降變化和不均勻沉降程度,首先用充水后的每次觀測的各監測點的高程與蓄水試驗前測得的相應點的高程進行計算比較,以取得各監測點的沉降量。計算公式如下:Si=Si前-Si后式中:Si前為蓄水試驗前測得的點i的高程;Si后為充水后的每次觀測的點i的高程,Si為點i充水以后相對蓄水試驗前的沉降量。沉降速度計算可參照相關規范和公式,由于本工程水池的沉降在第3次充水后的第3天(3月27日)后已基本穩定,所以這里不再贅述該水池的沉降速度計算和數據處理等。

5.2數據處理結果與分析

根據每次觀測的各監測點的高程,通過以上數學模型可以計算得出:各監測點的沉降量。若在沉降監測中發現建筑物有較大不均勻沉降時,需根據沉降量計算基礎的傾斜度。因本工程沉降監測過程中未發現較大不均勻沉降現象,這里不再贅述。其計算方法可參照《建筑變形測量規范》(JGJ8-2007)中有關沉降觀測的內容。通過表2中的相關數據可以清晰看出,在蓄水試驗過程中各監測點均有不同程度的沉降,試驗前期沉降量較大,隨著試驗的進行逐漸減小、趨于穩定,雖然沉降量的大小各異,但基本趨于均勻;總體來看,位于填方區的東南方向的沉降量大于位于挖方區的西北區域,但未出現較大的不均勻沉降現象;某些測點略有回升,也可能是由于測量過程中的誤差造成的。另外,在蓄水試驗完成水池內試驗用水全部排出后,各監測點均出現了一定程度的回升現象,其可能是因為水池基底土體受到的荷載卸載后,在基底應力場平衡的影響下,基底出現了回彈現象所致。

篇7

凱里供電局系中國南方電網公司和貴州電網公司領導下的國家大二型企業,擔負供電轄區內15個縣(市)及湘黔電氣化鐵路的電能供應、銷售與服務任務,并為黔電入粵、黔電入湘的重要通道,為貴州電網公司代管縣局最多(15個)的供電企業。該局年售電量40億千瓦時,轄區內高能耗負荷企業占總負荷70%左右,該局目前營銷工作面臨負荷結構不合理、代管縣局多的復雜管理形勢。如何有效的調動代管縣局主動做好轄區內的營銷服務工作,培育更多優質負荷,提高企業的營銷經營業績,成為該局營銷管理工作的研究重點。為此,該局通過建立電力營銷數據分析系統,客觀公正地評價下屬業績,導入競爭機制,不斷提高該局的營銷工作質量。

2建立實時數據跟蹤監控系統

凱里供電局針對需要實時控制的電量及電費回收等指標推行日報表和帳目日報表、周期性報表制度,建立起銷售狀況的實時監控數據分析系統。這里重點介紹電量銷售日報表和電費回收進度表。

電費欠費說明:

1.凱里供電局本月應收15478萬,截至8月30日下午6:00,本月實收14090萬,欠費1388萬,回收率為91.03%。凱里系統本期合并口徑新增欠費953萬,月末應收電費余額增加額為673.57萬,其中城區供電分局直管客戶欠費191萬(凱里紙廠欠費110萬,城區小客戶欠費81萬),直管縣局終端用戶欠費566萬(其中施秉恒盛公司欠495萬,市郊局小客戶欠23萬、鎮遠局小客戶欠47萬);臺江局欠192萬。

2.注意問題:凱里城區小客戶本月欠費可能較多,要加大催費力度;同時對凱里紙廠進行跟蹤催費。

銷售異常勢頭,跟進弱勢區域、弱勢類別。

(2)電費回收進度表。

欠費數目越大,時間越長,追討的可能性就越小,控制應收賬款的通用原則是對賒銷客戶設定信用額度和信用期限。凱里供電局要求各分縣局和大客戶管理所在每月24日后按日上報電費回收進度表。每月最后兩天在早會上通報。一方面提醒各分縣局和部門注意正常欠費的關注和跟進;另一方面對異常欠款及時暴光,及時檢點,及時追究,從上至下形成對應收賬款追討的巨大壓力。3建立月度營銷分析制度,做好營銷數據的月度分析

對于市場營銷部而言,簡單地根據營銷數據考核各分縣局和部門工作沒有任何意義,重要的在于你能引入公平的評估模式,讓各分縣局和部門的營銷負責人心服口服。

完備科學的月銷售分析應達到以下目的:

(1)分析整個地區局的當月電量、線損、欠費余額,同期增長率,教上月成長率。

(2)引導各分縣局和部門營銷負責人關注自己的電力銷售和電費回收是否健康。

(3)引導各分縣局和部門營銷負責人關注當月重要客戶的銷售。

(4)排除市場容量不同、市場基礎不同等因素的干擾,客觀公正地評估各分縣局和部門的銷售貢獻。

這里以月度下網電量分析表進行說明:

通過此表我們可以看到凱里供電局當月的售電量、累計售電量、成長率、同期增長率等,還可以看到各類別電量及所占的比例。更重要的是,我們可以看到各分縣局的售電情況,排名情況,對各分縣局進行點評,還可以要求后三名說明原因,給其營銷負責人相應的指導和壓力。

4小結

通過建立有效的電力營銷數據分析系統,凱里供電局實現了實時的銷售監控和周期性的分析反饋及控制,為提高企業經營業績奠定了基礎。

參考文獻

篇8

根據《國家電網報》的報道可以看到,在2014年,在南方某地區電力工作人員通過監測發現轄區內的一個電度表出現了電壓不穩的情況,這種情況的出現,就淺析“量價費損”在線監測過程中異常數據分析及處理楊娟國網山東鄄城縣供電公司274600說明此電表所管轄的區域內有違規用電戶,或者是記電表出現了問題。通過工作人員的連夜分析,發現是記電表的內部芯片出現了問題,正是因為這個問題才導致了整個電力系統的不穩。工作人員將所有記電表的內置芯片全部更換,發現電力系統開始正常運行,芯片更換后,追補到了六千余瓦電量,取得了階段性內的成功。這就說明,通過監測發現了數據異常后,需要及時的分析才能排除可能,從而“對癥下藥”。

3如何處理電力監測中的異常問題

隨著科技和時代的發展“,量價費損”在線系統在國家電網公司逐步實施使用,此種工具有著不同功能和作用,使用得當可以為企業增加經濟效益,如果使用不得當那么就會引起一系列的問題。國家電網公司在2013年上線試點了電力在線監測系統,對多個城市開展全面性的試點監測。主要工作原理是通過第三方平臺,對區域內的用電量、電價、電力傳輸線路等細節進行監測,如果在監測過程中發現了任何異常問題,就自動采用“閉環協調運作”的形式,可以讓工作人員在第一時間了解問題,從而解決問題。這個監測工具可以深入到用電系統的方方面面,將以往遺漏的地方全都納入監測之中。通過監測工具形成了按時匯報,定點處理的營銷機制,從根本上為復雜多樣的電力系統監測提供了高效優良手段。

3.1“量價費損”在線監測工具的運行機制

此監測工具主要是進行電力預警,將有可能出現的問題以形象直觀的方式及時反饋。一般來說,監測工具是使用多種類型的監測盤構成的,不同的監測盤負責監測電力系統的不同方面。監測盤可以通過人工定時的方式自動刷新,沒更新一次數據就是一次新的監測。通過監測盤,可以展現出電費、電價、電力使用情況等方方面面的數據,各種數據指標都是各電力工作人員需要著重構建用電系統的依據。其中不同顏色表示風險預警的不同狀態,如果是紅色,那么就說明電力系統存在高危風險,此時應該特別注意,全力排查有關問題。監測盤的指針如果落到了黃色區域,那就說明高危風險出現的幾率增加,此時應該防患于未然,如果指針在綠色區域,就說明一切指標和數據處于一個安全的狀態內,所有用電系統一切正常。

3.2“量價費損”監測過程中的問題預測

在電力監測過程中,除了有不同顏色的標注之外,還有彈出窗口作為提醒。這區別于不同的顏色風險區域,可以以更加醒目的方式提醒有關人員,引起全部人員的注意力。在電力監測過程中會發現,電費問題一直是一個難以解決的重要難題。因為用電戶繁多,沒法及時將電費收回,影響了電力公司的正常運轉。而在監測工具中,新增了智能運算這一個過程,可以通過有關程序,計算出有關的電費和電價,從而對相應的用電客戶做出提醒,降低電力系統的風險,這種省時省力的方式受到了良好的效果。

3.3“量價費損”在線監測的優點

在線監測工具在用電系統中的廣泛應用,使得各大城市可以在宏觀上把握各大電網的運行狀態。對于供電企業的決策處理水平有了一個很大的提高。供電企業的數據分析擺脫了低效的機制,從而構建了一個全新的用電管理系統。對于廣大市民來說,此種監測工具成為了溝通用電戶和電力公司的橋梁,在二者之間建立起一個良好的信譽體系,促進了節約用電的意識,規范了用電機制和模式??梢员WC日常生活中電費的順利上繳和回收。此種用電監測工具能在源頭上防止不正確的用電行為,保證了供電企業的經濟效益??梢源_保供電企業的資金合理運轉,杜絕了以往用電過多、蓄意浪費等不良行為。如果有蓄意欠費用戶,也可以通過監測第一時間發現,從而避免了供電企業的經濟損失。根據調查表明,在監測工具使用后,違章用電客戶比之前減少了百分之六十,大大增強了電力資源的利用率。

篇9

1978年底開始的農村家庭承包制改革,使農戶成為其邊際勞動努力的剩余索取者,從而解決了制度下因平均分配原則而長期解決不了的激勵問題(meng,2000)。與此同時,政府開始對價格進行改革,誘導農民提高農業生產率。在農業剩余勞動力被釋放出來后,非農產業活動更高的報酬吸引勞動力轉移(cook,1999),從而推動農村生產要素市場的發育,原來主要集中在農業的勞動力開始向農村非農產業、小城鎮甚至大中城市流動。

由于各種阻礙勞動力流動的障礙尚未拆除,以及政府鼓勵農村勞動力就地轉移的政策引導,20世紀80年代前期的勞動力轉移以從農業向農村非農產業轉移為主,主要是在鄉鎮企業中就業,即所謂的“離土不離鄉”。但隨著鄉鎮企業遇到來自國有企業、“三資”企業和私人企業越來越強勁的競爭,必須提高技術水平和產品質量,因而鄉鎮企業資本增加的速度逐漸加快,吸納勞動力的速度相應減緩。農村勞動力面臨著越來越強烈的跨地區轉移的壓力。與此同時,外商投資企業、中外合資企業、私營企業和股份公司等其他非國有部門在東部地區發展較快,擴大了對勞動力需求,并成為消除制約勞動力流動體制障礙的一支重要力量。

隨著農村勞動力就地轉移渠道日益狹窄,1983年政府開始允許農民從事農產品的長途販運和自銷,第一次給予農民異地經營以合法性。1984年進一步放松對勞動力流動的控制,甚至鼓勵勞動力到臨近小城鎮打工。1988年中央政府則開了先例,允許農民自帶口糧進入城市務工經商。到20世紀90年代,中央政府和地方政府分別采取一系列措施,適當放寬對遷移的政策限制,也就意味著對戶籍制度進行了一定程度的改革。例如,許多各種規模的城市很早就實行了所謂的“藍印戶口”制度,把絕對的戶籍控制變為選擇性地接受。此外,1998年公安部對若干種人群開了進入城市的綠燈,如子女可以隨父母任何一方進行戶籍登記,長期兩地分居的夫妻可以調動到一起并得以戶籍轉換,老人可以隨子女而獲得城市戶口,等等。雖然執行時在一些大城市遇到阻力,但至少在中央政府的層次上為戶籍制度的進一步改革提供了合法性依據。城市福利制度的改革也為農村勞動力向城市流動創造了制度環境。80年代后期開始逐步進行的城市經濟改革,如非國有經濟的發展,糧食定量供給制度的改革,以及住房分配制度、醫療制度及就業制度的改革,降低了農民向城市流動并居住下來和尋找工作的成本。

與其他方面的政策改革相比,戶籍制度改革在很長時間里沒有實質性的突破,成為勞動力流動的最大障礙。所有在就業政策、保障體制和社會服務供給方面對外地人的歧視性對待,都根源于戶籍制度。隨著時間推移,兩方面的因素變化推動政府對遷移政策進行改革。一是城市戶籍制度不再擁有外部或隱含的福利,也就是地方政府不再根據個人的戶籍來提供就業、社會福利等各方面保障。這樣,城市人口規模擴張不會給地方政府增添額外財政負擔。二是地方政府意識到,勞動力流動不僅帶來資源重新配置,而且也是城市融資的一個重要來源。這樣,市場化發育水平相異的城市根據各自目標來推進城市戶籍制度改革。

可見,通過戶籍制度及一系列其他阻礙人口遷移的制度因素的改革而推動的勞動力流動,不僅是經濟發展的一個重要內容,也是整個經濟體制向市場機制轉變的重要進程,并且以其他領域改革的進展為前提。這個轉變或改革的結果便是勞動力市場的形成與發育,勞動力資源越來越多地由市場來配置。而在整個經濟不斷市場化的過程中,人口遷移也表現出轉軌時期的特點。這是中國轉軌時期人口遷移的特殊性所在。本文旨在利用2000年人口普查資料來分析人口流動與市場化之間的關系。

一、轉軌時期人口遷移理論

人口和勞動力在地區間的流動,是勞動力市場在空間上從不均衡向均衡轉變的過程。發展中國家在其經濟發展過程中,伴隨著工業化和城市化發展,大量農村人口和勞動力從農村流向城市,從低生產率的農業部門流向生產率較高的工業部門。劉易斯(lewis,1954)認為,發展中國家存在著典型的二元經濟結構,農村存在著大量剩余勞動力和隱蔽性失業,農業中勞動力的邊際生產力幾乎等于零或為負值,農村勞動力從農業部門流出不會對農業產出帶來負面影響,反而使留在農業部門勞動力的邊際產出不斷提高;隨著城市中勞動力數量不斷增加,城市工資水平開始下降,直至城市部門的工資水平與農業部門的工資水平相等,農村勞動力向城市流動才會停止。在劉易斯的模型中,勞動力在城鄉之間可以自由流動,不存在顯著的制度。城市現代部門的較高工資水平和傳統農業部門的低工資水平,是勞動力在城鄉之間流動的驅動力量。在托達羅(todaro,1969;harris和todaro,1970)兩部門模型分析中,農村人口和勞動力的遷移取決于城市的工資水平和就業概率,當城市的預期收入水平和農村的工資水平相等時,勞動力在城鄉之間分配和遷移都達到均衡。

由于城市經濟存在著現代正規部門和非正規部門之分,農村勞動力向城市遷移首先進入非正規部門,然后才有可能進入正規部門就業。城市正規部門就業創造率越大,越有利于將更多的非正規部門勞動力轉入正規部門;城鄉收入差距越大,從農村流向城市非正規部門勞動力數量越多,城市非正規部門勞動力規模也越大。由于城市正規部門的就業創造率取決于工業產出增長率及該部門的勞動生產率增長率,城市工業的快速增長將有利于提高正規部門的就業創造率,從而減少城市非正規部門的勞動力規模。但是,這個效應有可能被城市工資增長所誘發的大量新增農村勞動力流入所抵消。因此,城市正規部門的就業創造結果帶來了城市失業率的上升。

費爾茨(fields,1974)認為,托達羅模型中沒有考慮農村勞動力在城市正規部門尋找工作的概率問題。由于非正規部門勞動力獲得正規部門就業機會的相對概率較低,流入城市的農村勞動力大多數只能滯留于非正規部門。他們之所以能夠接受較低的工資水平,主要是在于他們預期能夠從得到的城市正規部門工作機會中獲得補償。在托達羅模型基礎上,費爾茨引入了搜尋工作機會的觀點,一方面強調了城市制度工資和相對就業概率對遷移過程的影響,另一方面也指出,非正式部門大量不充分就業的勞動力保證了勞動力市場實現均衡時的失業率低于托達羅模型得出的估計。非正式部門大量不充分就業的勞動力存在,在一定程度上緩解了城市的失業問題。

隨著勞動力流動,城鄉勞動力市場開始相互作用。但是,根據托達羅理論,城市失業率上升將起到減緩人口繼續向城市遷移。如果依據費爾茨的觀點,城市勞動力市場似乎對農村勞動力流動的影響不大。相比之下,在成熟的市場經濟中,城市的失業率是影響勞動力流動的重要因素。托普爾(topel,1986)利用美國人口普查資料研究發現,1970~1980年,美國東部、中部和北部各州的平均失業率相對于全國水平上升了23%,同時西部和西南部各州的失業率卻顯著下降。同期,人口遷移的空間流向恰好與此相反,人口凈流入地區為西部和西南部地區,東部、中部和北部均為人口凈流出地區。

中國的人口遷移不僅具有發展中國家的一般特征,而且還有經濟體制轉型的獨特之處。如前所述,中國特有的戶籍制度及其改革過程,為人口和勞動力自由流動和擇業提供了制度基礎,這也是研究其他國家人口遷移的理論沒有遇到過的問題。隨著時間的推移,包括戶籍制度在內的各項市場化改革措施必然對人口與勞動力遷移產生顯著影響。同時,城市就業環境變化也為我們觀察城鄉勞動力市場的相互作用提供了條件。

首先,不僅是城鄉之間、地區之間的收入差距驅動人口的遷移,市場化水平在城鄉和地區間的差異也直接影響農村勞動力遷移決策,從而形成特定的遷移流向。在經濟發展的初期,資本相對稀缺而勞動力相對豐富。因此,中國經濟的比較優勢在勞動密集型產業。在20世紀80年代以前的經濟增長模式下,由于政府采取人為扭曲資金價格的方式,在資金密集型產業上投資過多,抑制了具有比較優勢的勞動密集型產業的發展,導致產業結構的扭曲,資源配置效率的損失。經濟改革以來,通過一系列制度變革,資源配置逐漸轉向勞動力較為密集的產業,較好地發揮了中國勞動力資源豐富的比較優勢。產品和生產要素市場的發育帶來了資源重新配置效率的改善,對經濟增長做出了重要的貢獻(cai等,2002)。由于生產要素市場發育上在地區之間不平衡,這種資源重新配置的效果主要體現在沿海地區。2000年,92.1%進出口貿易集中在東部地區,中西部地區分別為4.3%和3.6%.同年,86.5%的外商直接投資集中在東部地區,中西部地區分別為8.9%和4.6%.因此,勞動力遷移在東部地區更為活躍,遷移的流向也以從中西部地區向東部地區為特征。

其次,正如在其他國家觀察到的那樣,較大的遷移距離增加了交通成本、弱化了社會網絡關系和目的地的就業信息,減少了遷移者的收益預期,因此,遷移距離上升降低了遷移發生概率。工作的不穩定性和信息獲得的不確定性,不僅造成了遷移流向是一個從縣內流向縣外,從省內向省外的漸進過程,而且使得親友等社會網絡成為遷移者獲得非正規部門就業信息的主要方式。格林伍得(greenwood,1969)認為,遷移存量對人口在地區之間遷移扮演著社會網絡的作用。先前的遷移可以為后來者提供信息和其他方面的幫助,減少遷移風險,從而對后期的遷移產生影響。蔡fǎng@①(cai,1999)研究發現,75.8%的省內遷移者、82.4%的跨省遷移者的就業信息獲得是通過住在城里或在城里找到工作的親戚、老鄉、朋友獲得的。因此,農村勞動力向城市流動通常受到距離所反映出的社會網絡強弱的限制,形成分階段遷移。

第三,盡管戶籍制度繼續阻隔著農村勞動力向城市遷移,但市場化改革使得城鄉勞動力市場開始融合,城市就業環境變化必然對農村勞動力向城市流動帶來影響。隨著國有企業虧損和非國有部門擴大,越來越多的原國有企業職工開始和遷移者在非正式部門展開就業競爭。在這種情況下,農村勞動力“是走還是留”,取決于正式部門和非正式部門的就業狀況,而且其決策通常是暫時的,而不是長期的。這與harris和todaro(1970)模型中所討論的情況(遷移者在非正式部門臨時就業、等待得到正式部門就業機會),以及sethuraman(1981)觀察到其他發展中國家的情況(大多數遷移者將他們在非正式部門就業視為永久性的)都有顯著差異。一個普遍觀察到的現象是,中國農村勞動力向城市和發達地區流動,通常具有季節性特點,最多以年為單位在原住地和遷入地之間往返,呈現出“鐘擺式”的流動模式。正如solinger(1999)指出的那樣,城市對農村勞動力的大量需求是推進戶籍制度改革的必要條件。在非國有經濟、特別是外商投資較快的地區,市場力量日益顯現,遷移受到鼓勵。、空間分布特征變化

1990年以來,中國地區收入差距進一步擴大,吸引了中西部地區勞動力向東部地區流動。同時,要素市場發育及資源配置市場化程度,對地區經濟增長越來越起著主導性的作用。東部地區不僅對外開放時間早,而且市場發育迅速,較高的市場化水平不斷消除了勞動力等要素跨地區間流動的制度,以至成為勞動力流動的主要吸納地區。而勞動力向東部地區流動反過來也推動了該地區的經濟增長,改善了勞動力資源配置效率(cai等,2002)。表1顯示了人口遷移空間分布狀況的長期變化。1987~2000年,人口遷移的空間分布特征是:地區內部遷移(其中主要是省內遷移)比例始終高于地區間的遷移比例。但地區內部和地區之間的遷移比例則隨著時間不斷發生變化。東部地區內部遷移比例提高,東部地區流向中西部地區的比例下降。而中西部正好與此相反,中部和西部地區內部遷移比例趨于下降,中部向西部、西部向中部的遷移比例也在下降,而中西部向東部地區流入比例不斷上升。

注:(1)從統計口徑上看,1987年遷移數量包括遷入時間在半年以上的市、鎮和縣之間的遷移人口;1990年遷移數量包括遷入時間在1年以上的市、縣之間的遷移人口;1995年遷移數量包括遷入時間在半年以上的市,區、縣之間的遷移人口;2000年遷移數量包括遷入時間在半年以上的鄉、鎮、街道之間的遷移人口。(2)全部遷移人口包括地區內部和地區之間的人口遷移,不同年份在遷移時間規定和遷移范圍上的差別對地區之間分布會帶來一定影響。盡管如此,我們仍可以比較不同年份之間遷移流向的變化。

資料來源:《1987年全國1%人口抽樣調查資料》、《1995年全國1%人口抽樣調查資料》、《中國1990年人口普查資料》、《中國2000年人口普查資料》。

根據2000年第五次人口普查的10%資料顯示,全部遷移人口數量為1246萬,占總人口的10.6%,其中省內遷移為7.7%、跨省遷移為2.9%.在總遷移人口中,省內遷移的比重始終很高,為73.4%.當我們描述跨省遷移的流向時,其主要以東部地區為遷移目的地的傾向更加明顯。表2給出了三類地區跨省遷移比例的空間交叉分布。2000年,東部地區跨省遷移近65%集中在東部其他各?。ㄊ校?,中部地區跨省遷移超過84%集中在東部地區,西部地區跨省遷移超過68%集中在東部地區。從時間趨勢上看,1987~2000年,東部地區內部跨省遷移比例上升了近15%,而中西部地區向東部地區遷移比例上升將近24%,后者比前者高出9個百分點。

從流動的出發地和目的地看,遷移可以被劃分為城市到城市的遷移、城市到農村的遷移、農村到農村的遷移和農村到城市的遷移四種主要類型。從這種類型劃分來觀察地區間遷移的流向,也有助于我們理解轉軌時期中國人口遷移的特點。從全國來看,城市到城市的遷移和農村到城市的遷移是目前遷移的主要形式。2000年,兩者合計占總遷移人口的77.9%,而且農村到城市遷移的比重(40.7%)大于城市到城市的遷移(37.2%)。農村到農村的遷移比重較低,僅占全部遷移的18.2%.而城市到農村的遷移比例最低,不到總遷移人口的1/25.從時間趨勢看,城市到城市的遷移所占比重,在東部、中部和西部三類地區都呈現上升趨勢,而農村到城市的遷移比重略呈下降趨勢。

三、遷移的決定因素:計量分析

在遷移決定因素的實證分析中,早期的遷移模型將重力遷移模型和就業為目的的遷移模型合二為一,假定遷移數量不僅與遷入地和遷出地的人口和遷移距離有關,而且取決于兩個地區之間的工資和失業率的比較。通常,采用下列雙對數模型來分析這些因素對遷移流向的影響(lowry,1966;greenwood,1969;fields,1979)。即:。式中,m為遷移率,x為影響遷移流向的各種因素,d為遷移距離,i,j分別為遷出地和遷入地。

舒爾茨(schultz,1982)認為,人口變量反映的是其他影響遷移而沒有在模型出現的社會經濟變量的作用,它沒有行為學上的意義。由于遷移是人口增長的一部分,在遷移實證模型中引入人口規模會帶來計量上的共同偏差(fields,1979)。而且,由于遷移存量實際上是人口規模的一部分,如果在實證模型中同時引入這兩個變量,將帶來嚴重的多重共線問題,大大降低回歸參數估計的效率。因此,通常做法是在實證模型中不引入人口變量。

在回歸方程的函數形式選擇上,費爾茨(fields,1979)認為,遷移決策本質上是在相互排斥的替代方案之間的一種選擇,非對稱模型比對稱模型對人口遷移具有更強的解釋能力。此外,雙對數線性回歸方程還能夠消除奇異值和異方差對估計效率的影響,滿足理論上就業機會與工資之間的乘積要求,以及提高回歸方程的擬合程度等。他選擇了滯后解釋變量辦法來消除解釋變量的內生性問題。我們也采用了所有解釋變量數據均為1995年數據的辦法來解決遷移模型的內生性問題。

本文數據來自2000年第五次全國人口普查長表資料(10%樣本)和微觀數據(長表1%樣本),1995年全國1%人口抽樣調查資料及國家統計局《中國統計年鑒(1996)》。在數據處理上,正式出版的第五次人口普查長表資料沒有農村向城市跨省遷移勞動力數量及其失業率數據,我們利用第五次全國人口普查的微觀數據計算了這些數據。用于回歸分析變量的統計值見表3.

表3用于回歸分析變量的統計值

注:*根據微觀數據計算。

遷移率的計算,我們采用格林伍得(greenwood,1969)的定義,用1995年11月1日至2000年10月30日從省遷到省的人口數,除以1995年11月1日以前住在省的人口數。根據長表計算得到的遷移率,包括了所有年齡段跨省農村到城市、城市到城市、農村到農村、城市到農村的四種類型遷移人口;用微觀數據計算15~64歲農村勞動力向城市的遷移率。按照這種方法計算得到的兩個遷移率的平均值都不高(見表3)。

遷移距離為省會之間鐵路公里數。中國地域遼闊,鐵路是中國跨省遷移的主要交通方式。這點可以從每年春節農民工返鄉造成的鐵路擁擠狀況中得到印證。遷移距離不僅反應了用于直接交通費用的高低,而且在一定程度上代表了遷移所帶來的心理成本大小。隨著遷移距離增加,遷移帶來的不確定性和遷移風險也會上升,遷移成本隨之增加(schultz,1982;greenwood,1975)。這在勞動力市場不發達的情況下尤其如此。

直接用城市工工資收入和農村人均純收入來作為工資率的變量顯然不合適。隨著收入多元化,相當于實際收入的部分并沒有反映到名義收入之中,城鄉收入在可比性上也存在一定問題(solinger,1995;jefferson,1992)。奧尼爾(o''''neill,1970)建議采用消費指標來克服收入指標作為工資率變量上的不足。我們利用各省城鄉人口作為權重,對城鄉居民人均消費支出進行加權平均,作為各省的工資率變量,預期工資率對遷移流向存在兩種不同的效應。其中,遷入地為正向效應,而遷出地為負向效應。

1995年全國1%抽樣調查和第五次人口普查都對城鄉勞動力的就業狀況進行了統計。1995年調查問卷中有三項指標用來測度勞動力在調查前一周是否處于失業狀態:第一項是從未工作正在找工作,第二項是失去工作正在找工作,第三項是企業停產等待安置的勞動力。2000年人口普查只包括前兩項。據此可以計算得到1995年和2000年城鄉勞動力的失業率,分別為2.2%和3.6%.由于城鄉勞動力的失業率包括了農村勞動力,這低估了城市勞動力市場的就業狀況?!吨袊?000年人口普查資料》公布了分城市、鎮和農村的經濟活動人口資料,據此計算的城市、鎮和農村的失業率分別為9.4%、6.2%、1.2%.利用2000年微觀數據計算的城市本地勞動力、城市向城市遷移勞動力、農村向城市遷移勞動力的失業率,分別為9.1%、7.9%和3.6%.如果在遷移模型中忽略了遷移存量,將導致高估其他解釋變量對遷移的影響(greenwood,1969)。按照格林伍得的方法,遷移存量應該是以1995年為時點,計算出生在省且居住在省的所有人口。由于中國人口普查資料只提供了出生后一直住在本地和1995年11月1日之前遷入本地等資料,因此,我們采用1995年11月1日之前遷入本地人口指標作為遷移存量的變量。本文中長表的遷移存量包括所有人口,微觀數據的遷移存量只包括15~64歲的人口。我們預期遷移存量對人口遷移有正向效應。

在分析地區人均收入差異和經濟增長中,貿易開放程度通常被看做是影響地區收入增長的重要因素(barro和sala-i-martin,1995;cai等,2002)。貿易開放程度越高,參與國際市場一體化程度也越高。但是,扭曲的貿易和發展戰略也同樣起到擴大出口,提高gdp中的貿易份額比重。相比之下,外商直接投資是國外投資者的選擇。從長期來看,為了獲得最大利潤和規避風險,國外企業在其投資過程中要對各地的產品和要素市場發育情況、體制與政策的透明度等因素進行綜合考慮,并最終做出投資選擇。外資企業進入之后,它利用勞動力市場來解決用人需求,這與國有企業的人事制度形成鮮明對比。因此,我們選擇了外商直接投資作為市場化程度的變量,來分析它們對人口遷移的影響。改革以來,雖然所有省份的外商直接投資數量都在增加,但東部地區與中西部地區之間的差異在不斷擴大。中國人口遷移流向分布主要集中在東部地區,這與東部地區對市場化改革程度較高是分不開的。

四、回歸結果與討論

方程1~3是利用第五次人口普查長表資料得到的回歸結果,方程4、5是利用第五次全國人口普查微觀數據得到的回歸結果。由于海南、重慶、與其他省會之間距離未能得到,在回歸中剔除了這3個地區,長表資料中實際用于回歸的樣本數量為756個。在微觀數據中,由于有些省份的遷移率或農村向城市遷移勞動力數量為零,取對數后,這些數據變成缺省值,所以用于回歸的樣本數量為506個。

從表4回歸結果看,利用長表資料得到的回歸方程,解釋了大約60%的所有人口跨省遷移的行為;用微觀數據得到的回歸方程,解釋了大約30%的跨省農村勞動力向城市遷移的行為。表4的非對稱雙對數遷移模型估計結果也表明,遷入地社會經濟變量對人口遷移的影響大于遷出地這些變量所發揮的作用。

回歸方程1~5中大多數解釋變量的回歸系數t值,如遷移距離、人均消費水平、失業率、遷移存量等,都達到了1%或5%的顯著性水平,并且作用方向上與前面的理論預期結果也基本一致。

表4中回歸方程1和2的區別是采用了不同的失業率數據,前者是1995年的失業率,后者是2000年的失業率。使用1995年失業率數據雖然有助于克服內生性問題,但方程1中遷出地失業率回歸系數的絕對值大于遷入地失業率回歸系數的絕對值,這個結果可能與現實情況并不吻合。

1995~2000年,中國城市就業環境發生了急劇變化。伴隨著國有企業改革和城市社會福利體制改革,企業大量富余人員被釋放出來,城市失業率迅速上升。為了解決本地城市職工就業問題,不少地方政府采取了城市就業保護政策,這勢必對以就業為目的的勞動力流動產生較大影響。遷移者是理性的,如果目的地的就業機會較小,遷移者將選擇不流動,以減少遷移風險和成本。這樣,遷入地的就業機會就顯得更為重要。

表4遷移決定因素回歸結果

注:(1)采用異方差檢驗方法(breusch-pagan/cook-weisberg)發現,表中回歸方程的依次為:7.85、1.54、1.38、2.80、4.85.我們對回歸方程1、5采用robust估計來消除異方差的影響。(2)方程1和5的括號內為robustt值,方程2~4括號內為t值,*代表5%顯著性水平,**代表1%顯著性水平。

考慮到2000年失業率真實地反映了就業環境的變化,我們以回歸方程2為基準,分析不同因素對遷移的影響,并進行比較。在其他條件不變的情況下,遷移距離上升1%,遷移率下降1.08%.受遷移距離的影響,2000年跨省遷移人口比例不到30%,絕大多數遷移人口選擇了省內流動。遷移距離在空間位置上是固定的,但改善交通運輸條件和制定合理的交通價格有利于減少遷移者的遷移成本,促進勞動力流動。

在做遷移決策時,潛在的遷移者不僅要考慮兩地之間直接的收入差距,而且還要考慮到就業機會大小。在回歸方程2中,遷入地人均消費水平回歸系數在絕對值上是遷出地的近4倍,但遷入地失業率回歸系數在絕對值上是遷出地的3倍以上。遷入地失業率對遷移決策較大的邊際影響與遷移者面臨的選擇有關。本地勞動力市場狀況是既定的,遷移者對它別無選擇。相反,遷移者對遷入地勞動力市場是可以進行選擇的,失業率越高的地區,遷入數量就會下降。

目的地的就業信息提供和幫助,對遷移決策有重要作用。遷移存量的回歸系數也證實了這一點。社會網絡等非正規信息渠道雖然在遷移中發揮著重要作用,但隨著人口流動規模擴大,加快勞動力市場信息體系建設就顯得非常重要。

將外商直接投資變量引入回歸方程2,就得到回歸方程3.引入這個變量之后,遷移距離和失業率等解釋變量的回歸系數及其顯著性變化不大,而人均消費水平的回歸系數及其顯著性發生較大改變。從絕對值來看,方程3中的人均消費水平回歸系數小于回歸方程2中的回歸系數估計值,遷出地人均消費水平的回歸系數顯著性有所下降,主要是人均消費水平與外商直接投資之間存在較高相關關系導致的結果(注:人均消費水平與外商直接投資的相關系數為0.56.)??缡∪丝谶w移比例主要分布在東部地區,它與外商直接投資之間存在較強的相關關系(注:外商直接投資與遷移存量之間的相關系數為0.76.),引入外商直接投資變量之后,遷移存量的回歸系數數值下降約50%.為了觀察城市勞動力市場對農村勞動力遷移決策的影響,我們利用微觀數據做進一步分析?;貧w方程4引入了農村遷移勞動力的失業率,回歸結果進一步支持上述發現,即遷入地的就業機會對遷移者來說更為重要?;貧w方程5引入了城市勞動力失業率。結果表明,城市失業率對于農村勞動力跨省遷移率有顯著性影響,其回歸系數在絕對值上不僅大于回歸方程4中失業率的回歸系數,而且大于回歸方程2中的回歸系數,這說明城市勞動力市場就業形勢確實對農村勞動力的遷移決策有重要作用。改善城市就業環境將有利于促進農村勞動力流向城市,起到加速城市化的作用。五、結論

20世紀80年代以來在中國出現的大規模人口遷移現象,不僅具有發展中國家從落后的農業經濟向工業經濟轉變的一般特征,還具有從計劃經濟向市場經濟轉變的特殊性。將二者結合在一起,既有助于考察中國獨特的制度特征對人口遷移的影響,又能夠通過對中國案例研究來拓展遷移理論。

經濟發展水平和市場發育程度在地區之間的不平衡,決定了人口遷移的基本方向不僅是從農村向城市的遷移,而且是從中西部地區向東部地區的遷移。既然中國經濟的進一步增長仍然有賴于從生產要素市場發育從而勞動力流動中獲得資源重新配置效率(注:約翰森(johnson,1999)認為,在今后30年,如果遷移障礙被逐漸拆除,同時城鄉收入水平在人力資本可比的條件下達到幾乎相等的話,勞動力部門間轉移可以對年經濟增長率貢獻2~3個百分點。),加快中西部地區市場制度的建設,特別是清除阻礙勞動力市場發育的各種制度,可以引導和規范人口遷移,使其不僅具有微觀理性,而且具有更加理性的宏觀后果。市場化改革措施(如擴大外商直接投資和對外貿易等)所帶來的經濟發展將有助于獲得“一石二鳥”的功效,也就是講,它為勞動力流動不斷營造同樣的發展環境,并在創造就業機會的同時,推進城鄉戶籍制度改革。

「作者簡介蔡昉中國社會科學院人口與勞動經濟研究所所長、研究員;王德文中國社會科學院人口與勞動經濟研究所,副研究員。

「參考文獻

1.中國社會科學院人口研究所(1988):《中國74城鎮遷移抽樣調查(1986)》,《中國人口科學》編輯部。

2.國家統計局(1988):《1987年全國1%人口抽樣調查資料》,中國統計出版社。

3.國家統計局(1997):《1995年全國1%人口抽樣調查資料》,中國統計出版社。

4.國務院人口普查辦公室(1993):《中國1990年人口普查資料》,中國統計出版社。

5.國務院人口普查辦公室(2002):《中國2000年人口普查資料》,中國統計出版社。

6.barro,r.&x.sala-i-martin(1995),economicgrowth.newyork:mcgrawhi,inc.

7.cai,fang(1999),spatialpatternsofmigrationunderchina''''sreformperiod,asianandpacificmigrationjournal,vol.8,no.3.

8.cai,fanganddewenwang(1999),sustainabilityofeconomicgrowthandlabourcontributioninchina,journalofeconomicresearch,no.10.

9.cai,fang,dewenwangandyangdu(2002),regionaldisparityandeconomicgrowthinchina:theimpactoflabormarketdistortions,chinaeconomicreview,13,197-212.

10.cook,sarah(1999),surpluslaborandproductivityinchineseagriculture:evidencefromhouseholdsurveydata,thejournalofdevelopmentstudies,vol.35,no.3:16-44.

11.fields,g.s.(1974),rural-urbanmigration,urbanunemploymentandunderemployment,andjob-searchactivityinldcs,journalofdevelopmenteconomics2,165-187.

12.fields,g.s.(1979),placetoplacemigration:somenewevidence,reviewofeconomicsandstatistics,vol.61,issue1,21-32.

13.greenwood,j.michael(1969),ananalysisofthedeterminantsofgeographiclabormobilityintheunitedstates,reviewofeconomicsandstatistics,vol.51,issue2,189-194.

14.greenwoodj.michad(1975),researchoninternalmigrationintheunitedstates:asurvey,journalofeconomicliterature,vol.13,issue2,397-433.

15.harris,j.,andm.todaro(1970),migration,unemploymentanddevelopment:atwosectoranalysis,americaeconomicreview40,126-142.

16.jefferson,g.h.andt.g.rawski(1992),unemployment,underemploymentandemploymentpolicyinchina''''scities,modernchina,18(1),42-71.

17.johnson,d.gale(1999),agriculturaladjustmentinchina:thetaiwanexperienceanditsimplications,officeofagriculturaleconomicsresearch,theuniversityofchicago.

18.leweis,w.a.(1954),economicdevelopmentwithunlimitedsuppliesoflabor,themanchesterschoolofeconomicandsocialstudies22,139-191,reprintedina.n.agarwalaands.p.singh(eds.),theeconomicsofunderdevelopment.bombay:oxforduniversitypress,1958.

19.lin,j.yifu,fangcai,andzhouli(1996),thechinamiracle:developmentstrategyandeconomicreform,hongkong:chineseuniversitypress.

20.lowry,i.s.(1966),migrationandmetropolitangrowth:twoanalyticalmodels.sanfrancisco:chandlerpublishing.

21.meng,xin(2000),labormarketreforminchina,cambridge,uk:cambridgeuniversitypress.

22.o''''neill,j.a.(1970),theeffectofincomeandeducationoninter-regionalmigration,unpublishedph.d.dissertation,columbiauniversity.

23.schultz,t.paul(1982),lifeiimemigrationwithineducationalstratainvenezuela:estimatesofalogisticmodel,economicdevelopmentandculturalchange,30(3),559-594.

24.solinger,d.(1995),thechineseworkunitandtransientlaborinthetransitionfromsocialism,modernchina,21(2),155-183.

25.solinger,d.(1999),citizenshipissuesinchina''''sinternalmigration:comparisonswithgermanyandjapan,politicalsciencequarterly,vol.114,no.3,455-478.

篇10

泉州兒童發展職業學院,是閩南地區重要的學前教育培養基地,每年都會為社會輸送300~500名學前教育專業的學生,分布在閩南、閩西和閩北等地區,為提升海峽西岸的學前教育質量做出貢獻。為適應學前教育信息化進程,學院每年都會舉辦幼兒園信息技術師資培訓,培訓內容從以前單一的辦公化軟件應用基礎,發展到現在的多媒體軟件應用、課件制作等更高技能。

由于幼兒園教師多來自閩南三地,數量龐大,可以利用深度訪談、網上問卷、網下答卷等多種形式收集所需的信息,從而建立起相關的數據庫。隨著調查研究的展開,數據資料和信息量將會急劇增大。以泉州地區為例,截止到2004年共有幼兒園604所,加上各種幼教機構,將達到700個單位,一個普通幼兒園一般師資有40人左右,這樣單單泉州地區從事幼教行業的人員就有近3萬人,而每個教師的數據資料包含有多方面,其中包含著巨大的信息資源。要如何合理地、高效地挖掘出這些數據之間的關系,從而為我們的教育培訓提供指導,單靠傳統的數據分析手段是無法勝任的。因此結合筆者的實際工作以及所在單位的需要,引入一個新的研究方向:面向學前教育師資信息素養的數據挖掘技術研究。

數據挖掘,現在已經在一些領域上得到成功的應用,在高層次的教育管理領域的應用得到越來越廣泛的重視,不僅是師范院校、綜合大學,包括很多大公司、大企業也參與到這項造福未來的事業中。

在學前教育管理領域上,數據挖掘還是個全新的課題。本文將利用數據挖掘方法,分析被研究對象——幼兒園教師在使用信息技術過程中表現出來的信息素養,包括:

1.個人信息意識與態度,包括教師的業務能力、信息環境建設,以及教師的信息意識,利用信息手段解決工作和生活問題的主動性。

2.個人信息知識和技能水平,包括教師多媒體軟件使用情況、多媒體課件制作能力、網絡技能、知識技能與課件制作的能力。

3.個人信息素養綜合因素以及學習目標,包括信息化教學意識、信息道德與安全、信息技術培訓要求以及信息技術困難。

通過對以上三方面的研究分析,我們希望能從中找出影響教師信息素養提升的主觀和客觀因素,從而指導教師信息技術培訓方案的制訂,更有助于學前教育師資職前教學計劃的制訂以及培養目標的調整。

二、教育領域的數據挖掘技術應用現狀

在教育管理領域內,數據挖掘技術正在慢慢地被推廣,主要是應用在圖書管理、教務管理、教學評價、數據分析等事務中,但總體上研究不夠成熟。當前國內各大師范院校也意識到數據挖掘的重要性,在教育專業課程設置方面均開設了“數據挖掘”等相關課程,如南京師范大學的“Web數據挖掘與推理”、“數據庫與數據挖掘”等課程。隨著關聯分析、聚類、概念描述、偏差檢測等技術的不斷發展和完善,數據挖掘必將在教育領域中發揮越來越大的作用,同時隨著人們對這一技術的日益關注,相信其在教育領域的應用范圍也會越來越廣,從而快速推進教育的改革和發展。

在學前教育領域內,由于管理人員在技術上的不足,數據挖掘的相關應用基本上是空白,更多的是利用Excel圖表或SPSS等工具對調查結果進行簡單的匯總分析,得出結論。隨著信息技術的廣泛應用,學前教育界的專家也開始注意到信息素養的培養問題,并對幼兒園教師信息素養進行調查研究,但對于得到的數據、問題之間的內在關聯、相互制約等關系,沒能進行更有意義的發現、推理。

三、研究意義及方法

在學前教育領域中,作為主體的幼兒教師是一個特殊的年輕群體,她們普遍學歷不高,研究水平有限,學習能力也不如中小學教師,但卻是個充滿朝氣、積極向上的群體。由于特殊的教育環境、教學對象,使得她們需要借助更多高效的教學手段、教學模式來豐富課堂,吸引幼兒的注意力,提高教學效果,而信息技術正是最好的工具。因此,如何加強幼兒教師的信息技術能力,提升幼兒教師的信息素養,是一項非常重要的任務。筆者已通過調查問卷、網絡答題等方式,不斷地收集、積累相關數據,構建數據庫,而如何利用有效的途徑,并從這些數據中發現有用的信息,進而對信息技術教育課程改革提供指導,有著長遠的意義。

因此,本次研究的主要內容和所采用的研究方法可以概括為:

1.持續地通過問卷調查,網絡答題等方式獲取數據,形成“學前教育師資信息素養數據庫”,并結合個別訪談形式,探討泉、莆、廈、漳、龍巖等地幼兒教師信息技術整體水平;

2.根據領域專家要求,將各因素分成11個挖掘問題,并利用挖掘工具探索各因素之間的關系;

3.設計數據挖掘模型,利用數據挖掘工具,對不同的挖掘問題分別采用關聯規則、聚類方法進行研究;

4.探討不合理規則,利用測試數據集對挖掘結果進行檢驗;

5.挖掘結果可視化、直觀化,方便用戶對結果的理解。

參考文獻:

[1]杜安平,周期玉.Big6與當代大學生的信息素養構建[J].實踐研究,2006,(6):730-734.

[2]戴瑩.東臺市幼兒園教師信息素養調查研究[C].江蘇省2005年度學前教育優秀論文,2005.

篇11

財務分析的主要目的是改善經營管理,提高企業的經濟效益,其主要目的是保證會計信息資料的正確可靠性,以保證企業財產的安全性、完整性。比如某生態園林企業需要投入大量資金完善生產基礎設施,并保證現場作業的有序,如有必要還要投資于企業產品周邊附屬產業的發展,因此財務決策的重要性不言而喻,而在財務決策中應用數據挖掘技術十分必要。財務分析中應用數據挖掘的基本流程包括問題識別、數據準備、數據開采及結果表達與解釋等四個步驟,圖1可將財務分析數據挖掘的過程直觀的表達出來:

(一)問題識別

典型的財務決策包括投資決策、籌資決策、成本決策、銷售決策等,企業要進行財務分析前必須識別決策問題,明確需要達到的決策目標等,再將決策目標轉換為數據挖掘的目標,最后進行準確的數據定義。如企業需要投資企業產品周邊附屬產業,則需要利用數據挖掘技術明確以下問題:

(1)企業經營中可隨時支配的資金額度,需要財務人員建立數據庫模型,將可用于投資的資金情況準確、詳細的計算出來;

(2)編制投資方案,即與本企業實際情況相結合,考慮具體投資計劃,并對投資方案的可操作性進行分析,比如上述園林生態企業需要投資進口園林機械的項目,就需要在投資前對該項目的大小做出合理評估,了解該品牌園林機械在國際市場的占有份額、品質、成本及銷售價格等信息;

(3)投資收益分析,投資的主要目的是獲得更高收益,因此在數據挖掘過程中,問題識別時必須做出可靠的收益預算。

(二)數據準備

在完成問題識別后,需要根據不同的需求、從相關數據庫信息中選擇適用的數據信息,即進行數據準備,該過程需要收集大量與企業財務分析相關的數據信息,以保證數據挖掘的真實性、客觀性,比如花卉市場分布信息、裝飾裝潢市場信息、園林設計與市場銷售等信息。通常情況下,數據準備又可分為數據集成、數據選擇及數據預處理等三個步驟,其中數據集成是把多數據庫運行環境中的數據進行合并處理,去除信息噪聲,剔除虛假數據;而數據選擇則是分辨需要分析的數據集合,進一步縮小數據處理的范圍,提高數據質量,從而保證數據挖掘的有效性;數據預處理的主要目的是解決數據挖掘工具局限性的問題。

(三)數據挖掘

當上述準備工作完成后即可進行深入的數據挖掘處理,挖掘過程中需要注意,必須以財務分析核心思想為指導,明確數據挖掘的目的性,數據挖掘的主要內容包括:選擇合適的挖掘工具、具體的挖掘操作及證實發現的知識等,其中選擇合適的挖掘工具至關重要,限于篇幅此處對神經網絡及決策樹兩種方法進行簡單介紹。神經網絡是以自學習數學模型為基礎的,利用該方法可以很容易的解決具有上百個參數的問題,為高復雜度的問題提供一種相對簡單的方法;視經網絡既可以表現為有指導的學習,也可以是無指導聚類,不過輸入神經網絡中的值均為數值型的。實際應用中通常采用該方法進行財務預警分析。決策樹法是現階段應用最廣泛的歸納推理算法之一,其提供了一種展示在何種條件下會獲得對應值的規則的方法,是一種簡單的知識表示方法,在數據挖掘過程中,決策樹法主要用于數據挖掘的分類。

(四)結果表達

結果表達即是在處理數據庫信息的基礎上客觀的表達出數據挖掘的結果,以為企業財務分析提供可靠依據??梢哉f結果表達是數據挖掘的成果展示,其所表達的是最有價值的信息,如結果表達所提供的信息達不到決策的要求,則可重復挖掘過程,直至決策者滿意為止。

篇12

1按照國家稅務部門規定的相關稅率計算個人所得稅

首先根據工資額和納稅基數看所得稅算法,因為不同的應稅所得額有不同的稅率和速算扣除數,其他復雜的情況都可在此方法的基礎上變化得到:當月應納稅所得額=當月計稅總額-減除費用-附加減除費用。

以X代表應繳稅(減去免稅基數)的工薪(這里的個人所得稅僅以工薪為例),

Tax代表應繳所得稅,那么:

當500<X≤2000,則TAX=(X-500)×10%+500×5%=﹥TAX=X×10-25

當2000<X≤5000,則TAX=(X-

2000)×15%+(2000-500)×10%+500×5%

=﹥TAX=X×15-125

……

根據《稅法》規定依此類推,計算個人所得稅的通用公式為:個人每月應納所得稅=個人每月應納稅所得額糧梅段奧剩偎憧鄢?

因此,扣除數=上一范圍上限×本范圍稅率-上一范圍上限×上一范圍稅率+上一范圍扣除數。

例1:某人將自有機器一臺,轉讓給另一個人,取得價款15000元,減除機器原值及同時發生的拆遷費、運輸費8800元,其應繳納多少個人所得稅?

應納稅額=(15000-8800)×20%=

1240(元)。

上述公式說明:個人每月應納稅所得額=月工資額-非納稅項目(如住房公積金等)-800(元)。

2使用函數法巧算個人所得稅

了解了應稅額的計算方法,具體計算操作如下:

2.1用函數法巧算個人所得稅

(1)充分利用Excel中IF函數嵌套功能,可使上面問題得到解決,假設L列為“應納稅所得額”,M列為“應納個人所得稅”,在M列輸入公式(假設首位人員應納稅所得額位置L2):IF(L2<500,L2×0.05,IF(L2<2000,L2×0.1-25,IF(L2<

5000,L2×0.15-125,IF(L2<20000,2×0.2-375,IF(L2<40000,L2×0.25-1375,IF(L2<60000,L2×0.3-3375,IF(L2<80000,L2×0.35-6375,IF(L2<100000,L2×0.4-

10375,L2×0.45-15375))))))))

確認后,得出首位人員應納個人所得稅,拖動填充句柄,則所有人員應納稅額全部出來。該公式說明:①公式雖復雜,但只要一次輸入即可自動完成全部計算;②此公式在計算個人所得稅時可作為固定公式運用;③根據單位人員工資檔次情況,可簡化該公式。

根據稅務部門要求,認真貫徹《中華人民共和國個人所得稅法》,做好個人所得稅征繳和代扣代繳工作,現將在職人員個人所得稅稅率表(工資、薪金所得適用)予以公示。

(2)當月計稅總額是指當月全部工資、薪金、講課費、加班費、各項補貼、勞務等扣除公積金、社保支出后的余額。

(3)當月應納稅所得額是指當月計稅總額扣除減除費用、附加減除費用后的余額。

(4)離退休人員的工資、國家各項政策性補貼不計稅;其他部分不超過4000元的減除費用800元后按20%征收,超過4000元的減除20%的費用后按20%征收。

(5)外聘教師、其他勞務人員當月在本院各項不超過4000元的減除費用800元后按20%征收,超過4000元的減除20%的費用后按20%征收。

例2:在職教師王某10月份:①工資應發數為1850元(另扣公積金140元、社保支出40元);②講課費1200元;③校內津貼900元;④加班費200元;⑤其他勞務700元。則王某當月計稅總額為1850-140-40+1200+900+200+700=4670元;其當月應納稅所得額為4670-800-400=3470元(800為全國統一減除費用額,400計稅方法1:

3470元分為三級,500+1500+1470;第1級稅款為500×5%=25元;第2級稅款為1500×10%=150元;第3級稅款為1470×15%=220.5元;王某應繳稅款合計數為25+150+220.5=395.5元。

計稅方法2:

3470×15%-125=395.5元(125為3470元所在第三級的速算扣除數);王某應繳稅款395.5元。

2.2常規方法計算個人所得稅

(1)常規方法計算??鄢龜?應納稅范圍下限×本范圍稅率-應納稅范圍下限×上-范圍稅率+上一范圍扣除數。

那么公式為(以E3為例),E3=B3×D3-B3×D2+E2。E4~E10:根據E3填充得到。

(2)G4~G7分別輸入:“工資總額”、“納稅基數”、“應納稅額”、“個人所得稅”四項。應納稅額等于“工資總額”減去“納稅基數”,如果“工資總額”小于“納稅基數”,那么應納稅額為0,在H6=IF(H4-H5>0,HE-H5,0)。

(3)選擇“插入”|“名稱”|“定義”,在定義名稱對話框輸入max,在引用位置中輸入VLOOKUP($H$6,$B$2:$B$10,1),查閱應納稅額屬于哪個扣稅范圍。

(4)選擇H7=H6×VLOOKUP(max,$B$2:$E$10,3)-VLOOKUP(max,$B$2:$E$10,4)。

分析公式:VLOOKUP(max,$B$2:$E$10,3)查閱該扣稅范圍扣稅稅率;VLOOKUP(max,$B$2:$E$10,4)查閱該扣稅范圍應減的扣除數。

(5)在“工資總額”和“納稅基數”中輸入數值,即可得到個人所得稅額,也可以改變各應納稅范圍的上限和下限以及稅率。由于個人所得的稅率分為九級,如果使用IF嵌套的方式非常復雜,而且容易出錯,且一旦稅率發生變化或稅率等級增加,不宜修改。這里使用VLOOKUP函數來計算。

選擇工作表Sheet2,更名為“tax”,然后輸入所需稅率及扣除數。其中,扣除數一列可以直接輸入,也可以通過公式計算。那么公式為(以E3為例),E3=C3×D3-C3×D2+E2。E4~E10:根據E3填充得到。

計算個人所得稅。選擇單元格L2,輸入公式-(K2×VLOOKUP(VLOOKUP(K2,tax!$C$2:$C10,1),tax!$C$2:$E410,2)-VLOOKUP(VLOOKUP(K2,tax!$C$2:$C10,1)tax!$C$2:$E$10,3))。

由于這里引用工作表tax中固定的單元格,所以使用地址的絕對引用,這樣在后面用自動填充功能復制公式時,所引用的tax中的單元格地址才不會改變。公式前面加一個“-”(負號),是因為在這個工資表中,所有應扣除項都是用負數表示。

分析公式,其中:VLOOKUP(K2,tax!$C$2:$C10,1)查閱應納稅額屬于哪個扣稅范圍;VLOOKUP(VLOOKUP(K2,tax!$C$2:$C10,1),tax!$C$2:$E410,2)查閱該扣稅范圍和扣稅率;VLOOKUP(VLOOKUP(K2,tax!$C$2:$C10,1)tax!$C$2:$E$10,3)查閱該扣稅范圍應減的扣稅數。

利用自動填充功能,快速求出了所有職工的個人所得稅。

最后計算實發工資,實發工資應為“合計應發”減去“個人所得稅”后的數值,即在M2=J2+L2,然后利用自動填充功能,得到所有職工的實發工資。

2.3實際代扣個人所得稅時使用“取整”函數的方法

計算的個人所得稅額經常帶有角、分單位,給實際發放工資時代扣個人所得稅帶來很多不便。如利用電話費的繳費方法,將使代扣個人所得稅操作簡便。

這一方法主要是利用取整函數ROUND()四舍五入,舍角分取元為單位,其多交或少交的差額在下次抵補,累計計算。計算時需增加“上次結余”、“累計應代扣額”、“實際代扣額”、“本次結余”四個欄目,其中“上次結余”是反映上次多扣或少扣的金額。

3使用排序分段核算法計算個人所得稅

在工資表中只要增加“應納稅額”和“應納個人所得稅”兩項。

(1)計算應納稅所得額。對應發工資,薪金減除800元和扣除項目后,得出“應納稅所得額”。

(2)排序。將“應納稅所得額”應用Excel排序功能進行從小到大排序處理。

篇13

目前數據網絡在電力系統中的應用日益廣泛,已經成為不可或缺的基礎設施。國家電力數據網一級網從1992年2月一期工程開始規劃建設,到1997年7月二期工程開通運行,迄今已有近十年的發展歷史。目前國家電力數據網同時承載著實時準實時控制業務及管理信息業務,雖然網絡利用率較高,但安全級別較低、實時性要求較低的業務與安全級別較高、實時性要求高的業務在一起混用,級別較低的業務嚴重影響級別較高的業務,并且存在較多的安全隱患。隨著信息與網絡技術的發展,計算機違法犯罪在不斷增加,信息安全問題已經引起了政府部門和企業的高度重視。因此根據調度自動化系統中各種應用的不同特點,優化電力調度數據網,建立調度系統的安全防護體系具有十分重要的意義。

2.電力系統中各類網絡應用的特點

電力系統中網絡應用的分類方法有許多種,根據業務類型、實時等級、安全等級等因素,電力系統的網絡應用主要可分為生產數據傳輸和管理信息傳輸兩大類,另外其他的應用還包括話音視頻傳輸和對外服務等。不同的應用系統對安全有不同的要求,如圖1所示。

圖1基于數據網絡的應用系統對安全性的要求

生產控制類中的基于TCP/IP的數據業務,速率要求不高,數據流基本恒定,但業務實時性較強,其中遙控遙調更與電網安全直接相關,可靠性要求較高;與計費相關的電力市場業務對安全性有特殊要求,不僅要求可靠,原始數據還要求保密。從應用范圍來看,生產控制類業務分布在各網省調及大量發電廠和變電站,屬于較特殊的一類窄帶業務。

管理信息類業務突發性很強,速率要求較高,實時性不強,保密性要求較高,覆蓋除生產控制類以外的所有數據業務,其網絡布局集中于行政辦公中心,一般要求為寬帶網絡。

話音視頻類業務是指建立在IP平臺上的電話及會議電視,對實時性要求高,安全可靠性無特殊要求,目前其質量還有待提高。對外服務類業務則是指根據市場的需要而建立的數據網絡。

3.調度自動化系統的安全防護

3.1制定調度自動化系統安全防護策略的重要性

近年來調度自動化系統的內涵有了較快的延伸,由原來單一的EMS系統擴展為EMS、DMS、TMS、廠站自動化、水調自動化、雷電監視、故障錄波遠傳、功角遙測、電力市場技術支持系統和調度生產管理系統等。數據網絡是支持調度自動化系統的重要技術平臺,一般要求數據網絡安全可靠,實時性要求在秒級或數秒級,其中發電報價系統、市場信息等電力市場信息系統由于需要與公網連接,因而還要求做加密及隔離處理。

建立調度自動化系統的安全防護體系,首先要制定安全防護策略。應用系統的安全策略位于安全防范的最高一級,是決定系統的安全要素。從大的方面講,安全策略決定了一個系統要達到的安全級別及可以付出的代價;從小的方面講,安全策略的具體規則用于說明哪些行為是允許的,哪些行為是禁止的。系統是否安全,很大程度上依賴于最初設計時制定的安全策略,因為今后的安全措施,都圍繞這一策略來選擇和使用,如果在安全策略上出了問題,將會給今后的應用系統帶來安全隱患,從而使將來的安全建設處于十分被動的局面。因此考慮調度自動化系統的安全,應首先根據系統對安全性、可靠性、實時性、保密性等方面的不同特殊要求,按照國家有關部門的規定,從應用系統的各個層面出發,制定完善的安全防護策略。

3.2信息系統的安全分層理論

一個信息系統的安全主要包含五個層面,即物理安全、網絡安全、系統安全、應用安全、人員管理。調度自動化系統的安全防護體系應包含上述五個層面的所有內容。

物理安全主要包含主機硬件和物理線路的安全問題,如自然災害、硬件故障、盜用、偷竊等,由于此類隱患而導致重要數據、口令及帳號丟失,稱為物理安全。

網絡安全是指網絡層面的安全。由于聯網計算機能被網上任何一臺主機攻擊,而網絡安全措施不到位導致的安全問題。

系統安全是指主機操作系統層面的安全。包括系統存取授權設置、帳號口令設置、安全管理設置等安全問題,如未授權存取、越權使用、泄密、用戶拒絕系統管理、損害系統的完整性等。

應用安全是指主機系統上應用軟件層面的安全。如Web服務器、Proxy服務器、數據庫等的安全問題。

人員管理是指如何防止內部人員對網絡和系統的攻擊及誤用等。

3.3國家對網絡及信息安全問題的有關政策和法規

國家有關部門對安全問題的有關政策和法規,對制定電力調度控制系統的安全策略起到指導性的作用。

公安部是國家企事業單位及公共安全的主管部門,已經頒布了安全防護方面的一系列文件,正在制定安全保密和保護的等級,規定各部門應根據具體情況決定自己的安全等級,實行國家強制標準。公安部規定,從安全保密角度看,政府辦公網應與外部因特網物理隔離,并認為自動控制系統應與外部網絡絕對物理隔離,可根據業務的需要建立專用數據網絡。

國家保密局是國家黨政機關安全保密方面的主管部門,也頒布了一系列安全保密方面的文件。1998年10月國家保密局頒布的“涉及國家秘密的通信、辦公自動化和計算機信息系統審批暫行辦法”規定,涉及國家秘密的通信、辦公自動化和計算機信息系統的建設,必須與保密設施的建設同步進行,系統集成方案和信息保密方案不可混淆,應從整體考慮。1999年7月國家保密局發出的“關于加強政府上網信息保密管理的通知”、1999年12月10號文“計算機信息系統國際聯網保密管理規定”和1998年1號文“計算機信息系統保密管理暫行規定”均確定,涉及國家秘密的計算機信息系統,不得直接或間接地與國際互聯網或其它公共信息網絡相聯接,必須實行物理隔離。

1996年11月原電力部、國家保密局752號文“電力工業中國家秘密及具體范圍的規定”明確了電力工業中涉及的國家秘密和重要企業秘密,均必須參照國家有關保密方面的規定。

電力生產事關國計民生,電力系統的安全和保密都很重要,電力自動化系統要求可靠、安全、實時,而電力信息系統要求完整、保密。兩種業務應該隔離,特別是電力調度控制業務是電力系統的命脈,一定要與其他業務有效安全隔離。

3.4調度自動化系統數據網絡的安全防護策略

3.4.1數據網絡的技術體制

規劃數據網絡技術體制和電力系統安全防護體系,應根據電力生產業務對數據網絡安全性、可靠性、實時性方面的特殊要求,并遵照國家對單位和重要設施在網絡安全方面的有關規定。首先應根據網絡的規模、目的、服務對象、實時程度、安全級別等綜合考慮,確定最基本的網絡技術體制。

從應用和連接方式來看,企業內部網絡有兩類:一類是與公網完全隔離、在鏈路層上建立的企業內部網絡一般稱為專用網絡;另一類是連接于公網、并利用公網作為通道的企業內部網。第一類網絡除了面臨來自物理層面的安全問題外,主要面臨內部的計算機犯罪問題,如違規或越權使用某些業務、查看修改機密文件或數據庫等,以及從內部發起的對計算機系統或網絡的惡意攻擊。第二類網絡除了具有上述安全問題外,還要承受來自公網的攻擊和威脅,由于公網上黑客、病毒盛行,網絡安全的攻擊與反攻擊比較集中地體現在公網上。

由于電力調度數據網的服務對象、網絡規模相對固定,并且主要滿足自動化系統對安全性、可靠性、實時性的特殊需求,為調度自動化系統提供端到端的服務,符合建設專網的所有特征,所以電力調度數據網宜在通道層面上建立專網,以實現該網與其他網的有效安全隔離。

目前國家電力數據網同時承載著調度控制業務和管理信息業務,應當在將來通道資源允許的條件下,將現有電力調度數據網上的信息業務逐步分離出去,改造成為實時控制業務專用的數據網絡。

電力系統中的光纖通信網絡正在加緊建設,采用光纖+SDH+IP模式容易實現對不同IP應用業務之間的物理隔離,具有較高的傳輸效率,能滿足控制、保護等電力系統的關鍵業務的要求,便于調度部門能對網絡進行有效監控,并便于通信部門對外出租帶寬。因此用光纖+SDH+IP模式建立調度數據專網是一個適當的選擇,可以很好滿足電力系統的下列要求:

(1)數據傳輸的實時性(繼電保護毫秒級,自動化秒級),要求網絡層次簡化。

(2)傳輸的連續性,通信負荷基本恒定,需要恒定帶寬。

(3)遠方控制的可靠性(遙控、遙調、AGC等),要求有效隔離。

(4)因特網時代的安全防護體系(防黑客、防病毒、防破壞等)。

(5)網絡拓撲結構必須覆蓋遠離城市的電廠、變電站。

(6)充分利用SPDnet的現有設備,節約大量資金,便于平滑過渡。

3.4.2調度專用數據網絡的安全防護措施

調度專用數據網除了傳送EMS數據外,還傳送電能量計量計費、水調自動化、電力市場信息和調度生產信息(工作票和操作票、發電計劃和交易計劃、負荷預報、調度報表、運行考核等)。應根據各類應用的不同特點,采用不同的安全防護措施,如EMS等實時控制業務具有較高的優先級,應該優先保證,生產信息的優先級次之,而電力市場信息須進行加密處理等。

采用調度專用網絡體制使數據網絡在網絡層的的安全得到最大程度的保證。但也不能保證100%的安全,對調度數據專用網絡還必須做到技術措施和管理制度雙管齊下,才有可能從根本上保障信息和控制系統的安全。在管理制度方面,要做到:

(一)對全網實施監管,所有與電力調度數據網連接的節點都必須在有效的管理范圍內,保障安全的系統性和全局性。

(二)加強人員管理,建立一支高素質的網絡管理隊伍,防止來自內部的攻擊、越權、誤用及泄密。

(三)加強運行管理,建立健全運行管理及安全規章制度,建立安全聯防制度,將網絡及系統安全作為經常性的工作。

(四)聘請網絡安全顧問,跟蹤網絡安全技術。

在技術措施方面,要做到:

(一)在網絡傳輸層,為了保證數據網絡的安全,又能向外傳輸必要的數據,必須堅持調度控制系統與調度生產系統之間、調度生產管理系統與企業辦公自動化系統(OA/MIS)之間有效安全隔離,它們之間的信息傳輸只能采用單向傳輸的方式。常采用的措施包括防火墻、專用網關(單向門)、網段選擇器等進行有效隔離。另外在調度數據專用網絡的廣域網和局域網上,根據不同的業務系統,還可采取以下技術手段:

(1)網絡安全訪問控制技術。通過對特定網段和服務建立訪問控制體系,可以將絕大多數攻擊阻止在到達攻擊目標之前??蓪嵤┑陌踩胧┯校悍阑饓?、VPN設備、VLAN劃分、訪問控制列表、用戶授權管理、TCP同步攻擊攔截、路由欺騙防范、實時入侵檢測技術等。

(2)加密通信技術。該措施主要用于防止重要或敏感信息被泄密或篡改。該項技術的核心是加密算法。其加密方法主要有:對稱型加密、不對稱型加密、不可逆加密等。

(3)身份認證技術。該項技術廣泛用于廣域網、局域網、拔號網絡等網絡結構。用于網絡設備和遠程用戶的身份認證,防止非授權使用網絡資源。

(4)備份和恢復技術。對于網絡關鍵資源如路由器、交換機等做到雙機備份,以便出現故障時能及時恢復。

(二)在系統和應用層面,包括計算機防病毒技術、采用安全的操作系統(達B2級)、應用系統的關鍵軟硬件及關鍵數據的熱備份和冷備份等。防病毒技術和備份措施是通常采用的傳統安全技術,而安全的操作系統是一個新的發展趨勢。

4.結論

電力調度數據網絡是調度自動化系統的支撐平臺,網絡安全是系統安全的保障,專用數據網絡是整體安全防護體系的基礎,專網體現在網絡互聯、網絡邊界、網絡用戶的可管性和可控性。目前,國際上正在制定相應的自動化系統網絡安全標準,國內也開始進行相關課題的研究,對于調度自動化系統及數據網絡的安全防護措施,首先應在網絡技術體制方面,采用光纖+SDH+IP的數據專網模式,在全系統實現電力調度專用數據網絡與其它公用信息網絡、電力生產控制系統與辦公自動化系統等的安全隔離,同時在調度專用數據網及各相關應用系統上采取必要的安全防護技術手段,建立嚴密的安全管理措施,以確保電力調度系統和電力系統的安全。

參考文獻:

1.余建斌.黑客的攻擊手段及用戶對策.北京:人民郵電出版社,1998年

2.OthmarKyas著.王霞,鐵滿霞,陳希南譯.網絡安全技術-風險分析、策略與防火墻.北京:中國水利水電出版社,1998年

3.趙遵廉等主編,電力市場運營系統,北京:中國電力出版社,2001年1月

91综合网人人