<em id="f99rb"><form id="f99rb"><th id="f99rb"></th></form></em>

        <form id="f99rb"></form>

            <em id="f99rb"><span id="f99rb"><track id="f99rb"></track></span></em>

            首都科學講堂第680期《人工智能:最優化和數據科學》

            信息來源:北京科學中心      發布時間:2021-01-31

              2021年1月30日,首都科學講堂線上開講,本次首都科學講堂邀請了中國科學院數學與系統科學研究院研究員劉歆,為大家帶來題為《人工智能:最優化和數據科學》的精彩講座。

              人工智能:最優化和數據科學

              作為科學皇冠上最璀璨的一顆明珠,數學是一個非常抽象但是又極其重要的學科,人們經常問,到底什么是數學?數學到底跟日常生活有哪些關聯?從計算機到人工智能,它們如此“聰明”的原因是什么?

            第一講 奇妙數學:無處不在的最優化

              我們知道,數學是專門研究數量、結構、變化、空間以及信息等概念的一門學科,是所有科學密不可分的重要基礎。歷史上,數學的重要性被很多人推崇和肯定,哲學家柏拉圖曾說數學“是一切知識中的最高形式”,哲學家培根也將數學形容成“通往科學之門的鑰匙”。在數學家高斯眼里,數學是科學的皇后,因為在他看來數學是一門非常美的學科,二來是因為在西方的國際象棋中,皇后的作用是非常巨大的——既能當中國象棋中的車,橫走豎走,也可以像象一樣斜著走,是整個國際象棋中功能最強大的一顆棋子,由此可見,數學在高斯眼里是多么重要。

              數學主要可以分成兩大類:一部分是基礎數學,它包含了平面幾何、立體幾何、解析幾何;另外一種就是應用數學,它的分類非常廣、涉及得也非常廣,像概率統計、數學物理方程、系統與控制,而我們今天要談的最優化也是其中之一。

              作為一門古老而又青春的交叉學科,最優化將運籌學和計算數學交叉在了一起,那么到底什么是運籌學、什么是計算數學呢?

              提到運籌學,我相信大家應該都知道一句話,那就是“運籌帷幄之中,決勝千里之外”。這句話本來是劉邦對張良的評價,但是從科學的角度來看,它研究的正是千里之外的人如果想要贏,他需要做些什么、準備些什么,而這正是現代運籌學所思考的范疇,即在生產、戰爭或是勞動中,我們應該如何決策,才能取得最佳的效果。

              跟這個很像的還有“田忌賽馬”:齊威王喜歡賽馬,他有上等馬、中等馬、下等馬三種等級的馬匹,有個大臣叫田忌想跟王來賽馬。那很明顯,如果使用上等馬對上等馬、中等馬對中等馬、下等馬對下等馬,田忌無論如何都會輸。但是田忌人很聰明,他用自己的下等馬出戰齊威王的上等馬,用他的上等馬對齊威王的中等馬,用他的中等馬對齊威王的下等馬。這樣,田忌雖然第一場輸得非常慘,但后兩場他都勝了,結果就是2:1贏了齊威王。

              除了田忌賽馬,著名的歐拉七橋問題也是一個很典型的最優化問題:18世紀東普魯士有一個城市叫哥尼斯堡,這個城市被兩條河分成了四個區域,且這四個區互相之間又不連通。為了溝通方便,人們架了七座橋把這幾個區連接在一起,但后來人們就想,有沒有什么方法能一次性地把這七座橋都走一遍,但同時又不走重復路呢?基于這個問題,彼時的著名大數學家歐拉提出了“一筆畫”原理并以此得出了結論,即哥尼斯堡這個問題無解——人不可能不重復地走遍這七座橋又回到原點。

              這些例子都告訴我們,決策在生活中是非常重要的,決策者希望選擇對自己最有利的方案,而這個最有利的方案就是優化,就是我們這個學科的最優化。

              放到現代社會,運籌學的應用范圍就更廣泛了。在我國,山東師范大學的管梅谷教授提出了一個非常有名的國際問題叫“中國郵遞員問題”,這個問題是說,如果一個郵遞員從郵局出發開始投遞快件,他要怎么走才能一面走遍所有街道,一面還能確保他走的總路程最短?不得不說,尋找最優化方案幾乎滲透到了我們日常生活的方方面面,比如說網購賣家應該怎樣分配物流、分配倉儲、調配庫存?比如說如何考量是否應該在一個城市新建一座大橋,在哪里建才能緩解交通堵塞?……這些問題的背后其實都隱藏著很多有趣的數學模型。

            第二講 計算數學:從理論到實踐生產

              說過運籌學,我們再談談計算數學。舉例來說,當我們想買桌子的時候,很少有人會跟賣家說“我要一張邊長的桌子”,因為這個尺寸打造不出來,我們沒有一把尺子可以度量。那什么樣的尺寸是可以度量的?比如說1米——想打一張邊長1米的桌子非常容易,1.4米也容易、1.41米也還可以,但1.412米就有點難度了。換而言之,從1米、1.4米到1.41米再到1.412米,因為這些數都是有限小數,所以對于工程師而言它們都是可以生產的,但對于這種無限小數、無理數,尺子量不了工程師也就做不了,這個將理論和應用連接在一起的橋梁就叫“計算數學”。

              計算數學就是把數學家、物理學家們提出的一些無法從事實踐生產的方程,求解成小數點或帶若干位小數的有限小數,給工程師用來實際生產制造。而在這個過程中,跟計算數學關系最密切的就是方程,這個方程可以是數學的方程也可以是物理的,更可能是力學方程、電磁學方程、化學反應式。換而言之,將工程師和自然科學連接在一起的是計算數學,計算數學家通過寫計算機能夠識別的語言,讓計算機計算出一個工程師需要的數學精度,而實現這些的算法又需要大量的數學理論支撐。

              正如前文所說,運籌學和計算數學一同構成了最優化,也就是要研究在一定約束下,我們想要集小化一個或者是集大化一個函數,那么要如何設計計算機的算法,才能讓計算機實現這一點呢?這,就是我們最優化所研究的范疇。

              早年華羅庚在70年代推廣優選法的時候曾提出過一個概念叫“瞎子爬山”,其實這就是我們所說的“最速下降法”。具體來說,“瞎子爬山”說的就是跟人爬山會看路不一樣,計算機摸不清山峰在哪里,不知道如何才能繞著山路走上去,它就像是個盲人一樣。那它怎么“爬”?盲人有拐杖,他站在原地,通過拐杖他就能摸清哪里地勢最高、哪里地勢最低,這樣走一步摸一步爬到山頂。類似地,最優化里所說的“最速下降法”也是這樣——拿下降和上山相比對,當大家極大化一個函數的時候,如果想要取這個函數的負數,其實就等于去極小化一個函數,這跟“瞎子爬山”是找頂峰、最速下降是找“谷底”一樣,背后的邏輯和原理是一樣的。

            第三講 最優化與大數據、人工智能  

              那么學好最優化有什么用呢?談到它的應用,我們第一個想到的應該就是大數據和人工智能,首先我們來談一談大數據。

              事實上,大數據這個詞其實在20年前都沒有聽到過,也就是最近十多年才提出來的,究其原因還是因為人類獲取、存儲和處理數據的能力都獲得了提升。就拿我們經常說的追蹤大數據來說,它的本質其實就是人的行程,是我們手機記錄下的每個位置的軌跡形成,這樣的數據在日常生活中還充斥在各個方面,比如說銀行的、公安系統的、醫療問診的……可以說,這幾十年間人類獲取數據的能力都得到了巨大的提高。

              其次,我們的數據存儲能力也有了非常大的提升。在過去,我們用來存儲數據的軟盤只有幾十KB,現如今硬盤動輒就500G,更不用說像一些大的IT企業,他們還有著更高級別、存儲能力更高的數據存儲設備。因為獲取數據、存儲數據和處理數據的能力都得到了提升,所以我們如今才能談數據科學,而后者的本質實則跟數學建模非常類似,都是以生產實踐需求為基礎,然后研究如何通過數學手段來解決這些需求。

              在大數據領域,人工智能就是最優化的一個典型,那么到底什么是人工智能?說得簡單一些那就是,你將自己的所見所識所感甚至是決策輸入給電腦,用這段代碼來讓計算機“熟知”人的決策過程、“感知”同樣的事件,這樣在以后,計算機就可以做出相同的決策。當然不可否認的是,這是人類所設想的一個人工智能的終極形態,但我請大家仔細想想,想要實現這一目標的前提是什么?是數據的積累,只有有海量的數據才能實現這種決策,而這就是所謂的機器學習——它需要你先告訴它這段代碼,比如看到紅燈要停、吃到難吃的東西要吐,讓它學習遇到這種信息之后會采取哪些決策,當它的數據量積累到一段時間,它就可以告訴你“現在我知道如何對你給我輸入的情況做出正確反應了”。

            第四講 淺談人工智能中的最優化

              那大數據、人工智能又和優化有什么關系呢?在此之前,我們可以先看一個非常有意思的表格,這個表是告訴我們10的每一個量級對應的中文分別是什么,除了一、十、百、千、萬、億、兆,在此基礎上兆是10的12次方,京是10的16次方,垓是10的20次方……由此可見,從很早開始,中國人的思維就已經不局限于日常的范疇了。

                事實上,最優化也體現在人工智能的應用場景之中,譬如圖像處理。大家都知道,屏幕一般都是由一個個小顆粒組成的,這個小顆粒就叫像素、像素點,每個像素點存著一個灰度值,從全黑、0到全白、255,它中間有一個變化的過程,它分了256等,就是慢慢地漸變成從黑到白。

              那彩色的屏幕又是怎么實現的呢?大家知道有紅、綠、藍三原色,每一種原色它都對應一種灰度值,所以說每個小像素又是三組灰度值,即紅的、藍的、綠的灰度值分別是什么,它組合在一起就是我們看到的多姿多彩的色彩了。基于此我們可以知道,一幅圖片的本質是一堆海量數據,比如說1000×1000的圖片有100萬個像素點,它存儲的數字實則是300萬個,分別對應的每一個像素點是紅色、藍色、綠色。當我們把這個數目再擴大一倍——1萬像素×1萬像素,那就變成1億個像素點,那這幅圖像的規模會更大,但人在感知上就會變得更好,圖片“看上去”就更清晰、更好。

              再比如說,疫情期間也有很多事情跟最優化息息相關,比如說大規模的核酸檢測。之前新聞里說,我們能在三天之內測1000多萬個樣本,這是怎么做到的?我們十個一組測,而不是一個一個測,十個一組有問題了我們再單獨檢測,那么檢測的樣本量就從1000萬降到了100萬份,而這個過程體現的就是一個最優決策的過程。

              此外還有推薦系統,這也是我們特別熟悉的一個最優化場景。大家可能都知道,我們同樣是用一款購物APP,它的推薦產品卻不是一樣的,比如女生看到的可能是衣服、化妝品,男生可能看到的是球鞋、玩具,而這些都是根據用戶的習慣來推薦的;還有豆瓣的電影評分系統,它的背后也涉及到諸如“矩陣完整化”這樣的數學模型,而想要求解這個數學模型更需要我們尋找最優化方案,可見,推薦系統和最優化是密不可分的。

            午夜夫妻一级生活片 - 在线 - 视频观看 - 影视资讯 - 随缘网 Produced By 大漢網絡 大漢版通發布系統