IT龍門陣第 211 期

人工智能在細分領域的商業化探索

諸葛找房蘇偉杰:人工智能可以幫助用戶更有效率的找房子

現場互動

觀眾 : 我們數據堂云技術組的負責人,首先感謝戴總和蘇總這里,確實是AI的產品發展,帶動了大數據的行業,首先我來自大數據的公司我這里想問幾個問題,第一個先問戴總,首先呢,我知道因為我本身是做語音識別這么一個算是行業的學者吧,我知道咱們做這個小莫呢是語音識別的東西,這個涉及到語音識別層,還有NIP層,最終達到語義的理解,首先是很高級的一個層面,涉及到很大知識庫,特別關心APP背后的知識庫,是怎么構建,讓知識庫不斷的擴大,不斷完善支撐APP,適應行業人群的各種需求。
戴帥湘 : 我先說一個比較容易理解的,就是說數據堂有數據結構化和非結構化,百度這樣的數據,如果是結構化的數據,我們把它當做數字,結構化的數據,我們來說,就是數學里面的數字,這些結構數據庫里面的關系,相當于我們做了一定的預算,這個學術界也是認可的,沒有一個做的很好,我們對人物做的很好,不見得只是人物數據庫,我們做不同的混合的推理和認證,沒有差異,有可能專注到,人物地點是吧,各種知識這個要抓取的,這個數據委托大數據,就是大數據庫,我有了才有可能認可,有全部的,這個是技術方面,還有一部分,就是我剛才講的,主題講的,不是結構化數據,或者說你結構化不了,你沒法結構化,這個時候就需要少量樣本的學習,這個時候也做了大量的,完成學習任務,完成任務寫個三四個,就寫不下去了,你不知道誰的問法多,這種情況下必須走小數據的學習,你沒有別的方法來做,你也標不了太多。
觀眾 : 剛才過來聽,找房的時候,問一下這塊十分鐘刷新一個數據,這個必要是什么,不像那么高頻的數據變化,為什么十分鐘刷新一下數據,您說人工智能的運用,第二個問題是,您這些數據都從不同的數據源抓來的,那些數據源,這些數據有沖突怎么處理這些數據,是否涉及到人工智能的應用。
蘇偉杰 : 先回答您的第一個問題,就是為什么每十分鐘刷新一下數據,房屋的變更效率,對用戶價格很高,我們推出二十四小時降價的房源,基本上已經看到全北京市二十四小時降價的,這套房子降就意味著這套房子很快就會出手,我們會提出二十四小時漲價的房源,而是你還來得及和他談,所以房源數據的有效性,對用戶的價值很高的,房源會不會那么多,那么及時,這邊有兩個方面,一個是通過我們數據源去看,一個是多家委托,這房子掛在不同的網站,在單一的網站變化不會那么多,但是在多個網站數據變化就會相對多一些,我們確保我這套房子是最有效的,對所有的房源進行監控,但是我們也不能每十分鐘把對方網站掃描一遍,現在的房地產平臺,整個技術的背景還沒有那么好,我們訪問多了,對方網站也受不了,我們在某些網站不會達到十分鐘,相對延遲時間長一些,房源有效性保障數據質量很重要的前提。這個我們還是要去做的,另外一個您說的,在多個網站進來的時候我們處理,實際上我們所有數據進來之后,我們都會看看大數據是否之前存在過,是否在其他網站存在過,這是第二個層面,這個數據是不是臟數據庫里面存在的,這是第三個層面,對于數據處理這個邏輯還很多,我們數據的多因子聚合是一個最熱的數據處理方式是不斷回流的。
觀眾 : 我第一個問題想問一下戴總,咱們這款產品,您感覺跟百度的度蜜還有蘋果的SIRI,您的優勢是什么。
戴帥湘 : 我剛才在PPT里面也提到了優勢,沒有強調,我們是非常非常明顯地連續的對話,上下文觀念的理解,最后幫助你作出決策,三個層面都是,可以現場用度蜜,可以用SIRI,隨意問他,你找他能干的事情,有什么東西,你要加油,你可能要去醫院,如果他很好做,這些公司絕對不會放棄他,度米也是一樣,都做不到,這個時候很有門檻的,這個地方你們可能不相信,這是事實,沒有任何一家。

嘉賓觀點

新浪微博

參與評論

點擊獲取
 

(共有 條評論)網友評論

  
重庆快乐十分走势图快乐十分走势图