當前位置:學問谷 >

個人範例 >心得體會 >

專業前沿講座心得體會

專業前沿講座心得體會

專業前沿講座心得體會

近年來,數據挖掘引起了信息產業界的極大關注,其主要原因是存在大量數據,可以廣泛使用,並且迫切需要將這些數據轉換成有用的信息和知識。獲取的信息和知識可以廣泛用於各種應用,包括商務管理,生產控制,市場分析,工程設計和科學探索等。

機器學習和數據挖掘這些年一直是計算機應用方面研究的重點和熱點,首先要了解什麼是數據挖掘,簡單地説,數據挖掘是從大量數據中提取或"挖掘"知識。我一直對這方面的知識頗感興趣,這學期學院開設的學術前沿講座的課程,很有幸聽到了文益民教授對於自己在機器學習和數據挖掘方面研究的講座,讓我對這些知識有了深入淺出的理解,受益匪淺。

12月5號,文益民教授做了題為“大規模數據的分類”的講座,在講座的最開始,文教授提到了戈登·德萊頓《學習的革命》一書,皆在指導我們如何積累知識如何思考如何學習如何去做研究,具有拋磚引玉的指導意義。在這之後,又對了解機器學習和數據挖掘首先要了解的知識做了簡要的説明,比如對於問題的分類是分為線性問題和非線性問題;比如聚類的含義是將物理或抽象對象的集合分成由類似的對象組成的多個類的過程;比如對於這個世界上計算機的分類可以只分成工人(maker)和思考者(thinker)兩類。至此正式進入問題的討論。

對於這次講座,文教授從四個方面進行了講授。第一,實際應用中的大規模數據分類問題。第二,大規模數據給機器學習帶來的挑戰。第三,大規模數據分類算法的研究。第四,展望發展前景。文教授主要是在第三點中做了很多工作也取得了可喜的成績。

在機器學習的實際應用中,大規模數據分類問題一般會應用在以下幾個方面,在高速高精度的工業圖像檢測方面,在專利分類方面,在生物信息數據快速增長方面,在支持向量機參數選擇方面。

大規模數據給機器學習帶來的問題有:1、算法一般不是收斂太慢就是難以收斂,訓練時間過長。2、海量數據無法一次裝入內存。3、算法可靠性得不到保證。4、已經訓練好的學習器遇到心得訓練樣本時需要重新訓練。

在最重要的部分,文教授提到了幾個重要的研究方法,包括算法,這裏麪包含有:1、基於並行計算的算法,2、以並行計算方法求解工作集方法中每個迭代步中二次規劃的子問題,3、Meta-learning,最小最大模塊化支持向量機以及快速模塊化支持向量機,4、Cluster-SVM,Cluster-based-SVM,Cascade-SVM。文教授在第三和第四點中都有自己的工作和貢獻,在第三點中,他提出了分類面拼接算法,在第四點中,提出了分層並行支持向量機訓練算法。對於分類面拼接算法我進行了比較仔細的瞭解,並下載閲讀了文教授於2009年3月份在湖南大學學報上發表的論文“基於分類面的快速模塊化支持向量機研究”,對於分類面拼接算法有了初步的研究,下面説説我對這個算法的理解。

信息採集和信息處理技術的快速發展導致了諸如公共健康數據、信用交易數據、國家經濟普查數據、網絡文本數據和地理信息數據等大規模數據集的產生。由於訓練時間很長和空間需求很大,現有的大多數機器學習算法很難被直接用於大規模數據的機器學習。

這個算法是針對大多數現有的機器學習算法處理大規模問題時需要的訓練時間很長和存儲空間很大的難點而提出的,英文名是psfnrSVMs,

在訓練階段,psfm2SVMs採用一簇平行超平面對大規模問題實施軟劃分,然後針對每個子問題並行訓練支持向量機。在測試階段,測試樣本坐落於哪個子問題所在空間中,就由該子問題訓練的支持向量機給出判別結果。在4個大規模問題上的實驗表明:與採取硬劃分的快速模塊化支持向量機(fm2SVMs)相比,軟劃分能夠使psfm2SVMs得到更加光滑的分類面,因而ps2fm2SVMs的泛化能力較高。在不增加訓練時間的條件下,psfm2SVMs減少了由於訓練集分割導致的分類器泛化能力下降。

支持向量機方法的本質是在訓練集的一個高維像空間中尋找最大間隔分類超平面,這個分類超平面對應於訓練集所在空間的一個光滑曲面。如果採用訓練集分割的方法,將這個光滑曲面分段求出,然後進行連接,就可以得到這個光滑曲面的近似曲面。

該算法使用平行超平面簇對訓練集實施軟劃分,使得拼接後的分類面相比fm2SVMs得到的分類面更光滑,更接近最優分類曲面。因而,psfm2SVMs的泛化能力比fm2SVMs的泛化能力要高。在並行條件下,兩者的訓練時間和測試時間相同。在多核計算技術快速發展的今天,本文提出的算法,提供了一種可行的並行機器學習框架,對於研製高速高精度的機器學習算法具有一定的借鑑意義。未來計劃研究隨機向量w的方向對psfm2SVMs泛化能力的影響,並將該算法用於高速高精度工業圖像檢測。

這就是我的心得體會,在講座的最後,文教授還對機器學習和數據挖掘的未來進行了展望,諸如現在流行的雲計算,還有動態數據流學習,例外的發現,學習更復雜的函數,粒計算等等,都是今後發展的的熱點。聽完這個講座,我感到責任重大,即使是一個點,也還有很多方面值得拓展和探索,作為研究生,研究是我們主要的工作,想要取得滿意的結果和優異的成績,我們所要做的就是倍加努力,汲取現有的知識,在新的領域開拓新的研究道路,積極探索,永不止步。

在科學技術和信息技術的帶動下,經濟全球化的進程逐步加快,企業面臨的競爭已演變為價值鏈與價值鏈之間的競爭,為了提高供應鏈管理對我績效,要做到擁有高效運行機制的同時建立一個科學合理的供應鏈及其管理系統。因此,供應鏈優化勢在必行。

今天企業面臨的最大挑戰之一,就是要對從未有過的需求變數做出快速的反應。很多原因導致了產品和技術的生命週期縮短,企業間的競爭壓力也導致產品的頻繁變化。為了應對這個挑戰,企業需要集中力量做到比以前更敏捷,以便在更短的時間內對產量和種類的變化做出反應。一條快速的供應鏈能夠是企業更加快速的發展。

供應鏈的定義是:供應鏈是圍繞核心企業,將供應商、製造商、分銷商、零售商,直至最終客户連成一個整體的功能網鏈結構,通過對信息流、物流,資金流的控制,從採購原材料開始,製成中間產品以及最終產品,最後由銷售網絡把產品送到消費者手中。供應鏈管理的基本概念使供應商、製造商、分銷商、零售商和最終 用户形成整體的功能網鏈;包括所有加盟企業(節點企業);從原材料供應開始,直至最終產品;通過供應商到用户的物料鏈、信息鏈和資金鍊,實現增值鏈,即使相關企業都有收益(多贏)。

首先,供應鏈管理把產品在滿足客户需求的過程中對成本有影響的各個成員單位都考慮在內了,包括從原材料供應商、製造商到倉庫再經過配送中心到渠道商。不過,實際上在供應鏈分析中,有必要考慮供應商的供應商以及顧客的顧客,因為它們對供應鏈的業績也是有影響的。

其次,供應鏈管理的目的在於追求整個供應鏈的整體效率和整個系統費用的有效性,總是力圖使系統總成本降至最低。因此,供應鏈管理的重點不在於簡單地使某個供應鏈成員的運輸成本達到最小或減少庫存,而在於通過採用系統方法來協調供應鏈成員以使整個供應鏈總成本最低,使整個供應鏈系統處於最流暢的運作中。

第三,供應鏈管理是圍繞把供應商、製造商、倉庫、配送中心和渠道商有機結合成一體這個問題來展開的,因此它包括企業許多層次上的活動,包括戰略層

次、戰術層次和作業層次等。

儘管在實際的物流管理中,只有通過供應鏈的有機整合,企業才能顯著地降低成本和提高服務水平,但是在實踐中供應鏈的整合是非常困難的,這是因為:首先,供應鏈中的不同成員存在着不同的、相互衝突的目標。比如,供應商一般希望製造商進行穩定數量的大量採購,而交貨期可以靈活變動;與供應商願望相反,儘管大多數製造商願意實施長期生產運轉,但它們必須顧及顧客的需求及其變化並作出積極響應,這就要求製造商靈活地選擇採購策略。因此,供應商的目標與製造商追求靈活性的目標之間就不可避免地存在矛盾。

供應鏈是一個動態的系統,隨時間而不斷地變化。事實上,不僅顧客需求和供應商能力隨時間而變化,而且供應鏈成員之間的關係也會隨時間而變化。比如,隨着顧客購買力的提高,供應商和製造商均面臨着更大的壓力來生產更多品種更具個性化的高質量產品,進而最終生產定製化的產品。

在聽講座的時候老師講得很認真,我也帶着解決以下五個問題嘗試着學習。包括物流管理與供應鏈管理的關係處理,物流企業和生產製造企業物流的視覺差異、物流管理戰略和戰術問題的區分與協調、反映物流領域的最新研究與實踐成果及理論性與實用性相合共五個問題。

學習的過程可以分為兩個階段,一從被動地聽老師授課,起初就覺得講座理論性太強,而可感性又不高,難以更好的理解書中的理論,沒法更好地學習知識點,二對課本上所提到的案例加上老師的講解後,案例具體的指出存在的相關問題,並提出的對應的解決措施,我對課程理論的學習進入了半知半解的狀態,有了一定的認識、瞭解、感悟,通過聽講座我對書本的理論又有了進一步的認識,可感悟有了進一步的提升。對比自己本學期所學到的'知識及能力,感覺自己再具體提出相關解決措施的時候,沒辦法更好的調研、分析,得出解決的方案,理論與實際的兩者結合不夠,沒辦法列出更為具體且行的方式以解決問題,提出方案的可操作性都有待提升。

自己學習方面的轉變由只是老師講解,轉變到了自己主動去了解、學習。通過自己上網下載相關案例,學習更多的東西。這就是我這學期有學習進步的地方。

不足之處:由於是第一次聽這一類的講座,自己沒辦法去了解到哪些途徑與方法能夠更好的解決我們的問題。

通過本學期的學習,我明顯的感覺到了,在看待問題,分析、解決具體問題方面的能力,明顯不足,心態上有些急切,很想學習相關方面的具體解決問題的知識,進一步提升自己。

在進一步學習的方面,我希望老師能再強化學生在這方面的意識,旨在合適的時候指出學生的不足和問題,讓學生更好的意識到問題,有何途徑去更好的解決問題,灌輸樹立學生們樹立這方面的意識或習慣。

學生和老師的溝通不足,導致學生上課沒辦法更好的與老師所講解的內容,能有知識。思想或思維上的碰撞,擦出思維碰撞的火花。在講座之前,老師能先提前跟下節課有關的案例,課後讓學生更好的在課前提出相關的問題,講座上引導學生更好的在課前思考提出相關的問題,講座上引導學生廣泛地參與到思考與討論中出現了什麼問題,為什麼會出現問題,怎麼去解決問題,為什麼要這麼去解決問題,如何具體的提出相關可行具體的方案去落實。這樣子就能更好地讓學生對理論與運用有更深地認識了。

通過這次講座我不僅學習到了專業知識,也使得我的視野更開闊了,學習能力也提高了。我覺得這是我踏上社會之前收穫的一筆財富。

專業前沿講座心得體會

聽了幾位老師所講的學科先沿講座,我的感想頗多。 尤其是對林林老師的《智慧時代中的挑戰與機遇》頗有感觸。下面我談談自己通過聽講,查資料,經過思考後對這一問題的理解。 當今的信息新技術主要包括這麼幾類,即新息安全新技術:主要包括密碼技術、入侵檢測系統、信息隱藏技術、身份認證技術、數據庫安全技術、 網絡容災和災難恢復、網絡安全設計等。信息化新技術:信息化新技術主要涉及電子政務、電子商務、城市信息化、企業信息化、農業信息化、服務業信息化等。軟件新技術:軟件新技術主要關注嵌入式計算與嵌入式軟件、基於構件的軟件開發方法、中間件技術、數據中心的建設、可信網絡計算平台、軟件架構設計、SOA與RIA技術、軟件產品線技術等。網絡新技術:網絡新技術包括寬帶無線與移動通信、光通信與智能光網絡、家庭網絡與智能終端、寬帶多媒體網絡、IPv6與下一代網絡、分佈式系統等。計算機新技術:計算機新技術主要關注網格計算、人機接口、高性能計算和高性能服務器、智能計算、磁存儲技術、光存儲技術、中文信息處理與智能人機交互、數字媒體與內容管理、音視頻編/解碼技術等。

大膽的預測一下計算機技術往下怎麼發展,因為形勢明白了,歷史規律搞清楚了,需求也明白了,該怎麼做呢?我大膽做這麼一個發言,中國計算機界必須把握機遇迎接挑戰。看一下處理器方面該怎麼做,上個世紀我們關心的是每秒種可以完成多少指令,處理的速度。後來發現不對,應該做高性能的處理器,每花掉一塊錢可以處理多少能力,重要的是功耗要低,然後是無線,是互聯,我們更關心消耗每瓦功率處理能力是多少,大家關心的點開始轉移,從每秒處理能力,關心到每塊買到多少處理能力,到最後消耗每瓦功耗有多少能力。在處理結構上面有什麼變化,從上世紀70年代左右,人圍着計算機轉,每個單位只要很好就有一個漂亮的機房,大家圍着機房轉,算題是通過一個小窗口把題遞進去,過一段時間裏面算好,把題遞出來。那時候一切圍繞CPU轉,所以那時候CPU當之無愧,我的處理器是中心所以叫CPU。再往下可以看到計算機圍着人轉,我們口袋裏的手錶等一切一切,人走到哪裏,計算裝備圍着我來轉,在機器內部不是圍着CPU轉,而是圍着存儲期,I/O,通道轉,因此不能光搞CPU,比如出現PIM等新的名稱,所以我們應該與時俱進。從CPU,C要改成無處不在的處理單元。

網絡將怎麼發展,我們在上個世紀70年代所關心的就是互聯互通互操作,在這兒不是講互聯互通互操作不重要,它是一個基礎絕對重要,關心這個是數據和控制信號的傳遞,數據和控制信號可以傳過去。做了一些日子以後發現,需求不僅僅是這個,我們要提高網絡的帶寬,我們關心是信息溝通和處理能力的增強,光把信號傳過去是不是可以處理好呢?再往下又是怎樣的?我們應該關心網上有這些信息,有這麼多人用,是動態的變化,所以我們要關心信息融合、信息確認等。要把消息傳給該給的人,該給的時間,該給的地方,該給的人,傳正確的東西,這個變化不承認不行的,以往包括我個人在內,我和我同事們宣揚,看我家裏環境,辦公室環境,我計算機有多少能力聯網,這已經過去了。下面關心的是這個網絡具有多少計算個算計的能力,算計要做推理更難,再往下要面對什麼問題?我的網絡環境怎麼樣有非常強的資源按需聚合,人機協同工作的協調能力,體系結構將怎麼發展,70年代的時候,大家做體系結構設計,費勁腦筋是在計算機內挖掘可能的潛力,處理可能的矛盾,搞體系結構的人,什麼是好的所長,廠長,它的學問是處理輕重緩急,這件事應該放得下,哪件事應該要處理,所以好的應該處理刪、增、減、抑、揚,在這種情況下發現,我們設計在機羣中挖掘和平衡,我們要在網絡環境下怎麼做挖掘和平衡,因為系統給人用的,機器的環境,是給銷售人員,管理者用的,所以把協同工作做好,就要驗證,所以從HPCS變成HPCE,我們需要的不是高性能,需要的是生產力可用性,中國科學家預感比較早,因此1997年再一次會上,就決定當前做ClieitServer,之後做Cluster,之後做Networking,之後是VSE,基於網絡的虛擬服務含量是未來體系結構的發展方向。這是1997年8月25號,到1998年的時候,世界有名的計算機科學家Isea發表了GRID專著,我們要把GRID定位了,而是要考慮你究竟想幹什麼?我們做一個好的系統,必須要看到定位準確,你在這個座標上關於服務,你是要做計算服務,還是數據服務,還是應用服務,還是信息服務,還是知識服務,還是實用的服務。如果明確了你的目標,你的技術就明確,你的評價指標就明確了。如果要做信息服務,你就要了解你處的信息是多大一塊,這件事很重要,不能殺雞用牛刀,也不能殺牛用雞刀,如果系統力度大小這麼大,最後生產的問題,究竟打算怎麼交帳,是向投錢的單位交一個概念的設計,不是不可以的,還是交一個機理的設計,還是規則的設計,還是方法的設計,如果明確了,你的技術方案就明確了,你的機理就明確了,如果選定的方法層,你係統就要定位在這裏,位置定對就滿足正確的需求。

軟件該怎麼發展?上世紀70年代,大家關心的是編程,工具集這麼東西,我們進行了程序設計,後來發現要解決問題,要做面向對象的中間件等,而且軟件工程是很重要的,由於網絡的發展,再往前走一步,發現面向對象還不夠,我們要發展高效,智能體的,我們要做驗證技術,要做需求工程。也就是由於關注點變了,過去軟件做幾十年做Know how,今後要做Knog what,為什麼而做。恩你要關心資源是面向個人,還是網絡,還是人機協同,由於需求不一樣,技術變化整個50年進步比較快,從面向對象做消息傳遞,發展到面向構建,發展到面向Web服務做HML,後來發展到面向語義網絡的語義服務。再往下發展什麼?我們大家應該關注怎麼做描寫需求和行為的描述語言,根據這種描述語言做更高檔的編譯系統,所以我歸納四句話,對於軟件工作,最核心是提煉出與需求相應的抽象,開發面向應用需求和系統行為描述語言是關鍵,層次越高的抽象需要功能越全的編譯技術,所以編譯的同志要加把勁,抽象層次和編譯質量直接決定系統的效率。

信息安全和可信,問題更加嚴峻,上世紀7、80年代,我們關心密碼和糾錯,數據存儲和交換的正確性,現在這已經成為很大的產業,往下怎麼走,不能僅僅關心這個,因為更大的隱患是網絡的協議和網關上,要關心網絡通信的安全性,再往下,因為系統的安全,信息系統的安全必須系統性解決,要關心繫統維護,內容驗證,應急拯救長效機制。

以上就是我對計算機挑戰與機遇的思考。

  • 文章版權屬於文章作者所有,轉載請註明 https://xuewengu.com/flgr/xinde/vvy6g1.html