[心得] 中國自然語言NLP 面試心得

看板 Soft_Job
作者
時間
留言 40則留言,21人參與討論
推噓 12  ( 12推 0噓 28→ )
以下為本人今年 2019 4月到6月之間。 在中國面試的一些經歷。 稍微整理一下,讓大家看一下現況。 ------------------------- 1. QQ 瀏覽器 - 全網知識圖譜 搜索問答 電話面試 word2vec 演算法細節,fasttext 演算法細節。 fasttext 相較於word2vec 的改進方法。 大量的 Char n-gram 如何存。 知識圖譜抽取過程,實體識別(NER),關系抽取(Relation Extract)。 關系抽取如何遠程監督學習(Distance Supervised Learning)。 對於知識圖譜建立還是問答系統比較有興趣。 多任務詞槽填空細節,意圖識別方法。 2. 百度 國際化輸入法 - 自然語言處理 Round 1: 電話面試 lstm 演算法與數學細節 訓練時 Batch size 如果決定 Rnn lstm gru 數學與參數量 比較。 Word2vec 演算法細節 Transformer 的 multi-head 目的,怎麽做。 公式的 Q,K,V 什麽意義,怎麽算出來。 Multi-head 的輸出怎麽算出來 兩個字串編輯距離演算法 Round 2: 現場面試,白板題 CRF HMM 兩種模型差異 如何 訓練 HMM SVM 與 LR 差別在哪,從loss function 角度來思考。 給定一個排序後陣列 ,取 sum 為 n 的所有組合。 3. Lazada 數據科學家 Round 1: 電話面試 實體抽取模型細節 候選答案排序的權重計算 Attention 機制原理 有沒有使用過預訓練模型,BERT 懂不懂 Transformer 優點在哪 Round 2: 視訊面試 知識圖譜的建立,Entity 的屬性怎麼訂,有哪些類型的 Entity 臺灣跳到中國的原因,現在換工作原因,怎麼沒考慮內轉 對 Lazada 公司的了解,怎麼沒找競爭公司 蝦皮。 過去做的各種項目細節,有什麽改進的空間 項目為什麽用了 Transformer 導購機器人從無到有會怎麽做 沒語料又要做個性化標簽要怎麽做 怎麽規模化 (被反駁經驗不足:從無到有做導購, 不要馬上想做個性化,應該先做通用型的) 一周寫多少程式,最近寫了什麽程式 Binary search 怎麼做,計算複雜度。 分詞演算法,最大長度匹配 。 小語種 NLP 處理經驗 4. 字節跳動 Lark 自然語言處理 面試方式: 視訊 (ZOOM) 如何整理問答語料 如何驗證問答結果正確性 如何做對話狀態追蹤 是用什麼方法 文本分類的詞向量如何轉成句子向量 深度學習過擬合解決方法 為什麽dropout 可以解決過擬合 問答要做成各性化推薦怎麽做 質疑以往的各種項目業務價值不清楚。 質疑原公司團隊的技術分工不合理。 5. 阿里 無人車(小度車載OS) 自然語言處理 Round1: 現場面試,白板題 如何技術問答系統 用戶意圖不明,模糊語意下的各種處理方式。 用戶意圖不明時,多輪問答怎麼做。 Round2: 現場面試,有點像是批判性壓力測試。 叫你畫出 以往項目的各種系統架構。 開始對你的架構進行各方面的批評,並問你該怎麼改進。 準確率招回率如何提升。 總覺得對方一直在沒有目的的跳針,抓不到對方要的東西。 於是反問:你們需要怎樣的人。 對方: 我們需要的是,問答的回答不是用戶想要的情況。 要從架構的角度提出統一解,而不是修修補補的提出各種 Trick 解決片面問題。 Round3: 主管面 雙方確認彼此工作內容,雙方確認加班強度。 雙方交流車載系統現在市場現況,推行時的一些困難。 ------------------ 其他小公司就不說了,蠻雜亂的。 自己最後去的也跟以上無關,轉個方向去做推薦系統了。 職場觀察1: JD 掛羊頭買狗肉的行為很多。 簡歷刊登母公司,結果面試子公司。 招聘單位掛美國上市的趣頭條,結果打電話過來是母公司 InnoTech。 招聘單位是掛 阿里,結果打電話過來是 新加坡 Lazada。 招聘單位是 TCL 深圳,結果打電話過來是要人去香港。 招聘單位是 微軟 上海,結果要人去蘇州工作(年薪還不高)。 職場觀察2: 中國的國際化 中國內部市場競爭激烈,許多大廠的新業務都是在海外了 尤其是東南亞(因為打不進歐美) 只要是打著國際化業務,大概都是東南亞或中東業務居多。 觀察3: 沒有爽的工作 沒有高薪(稅前百萬以上)、有名氣(五百強,萬人互聯網公司),又能準時下班的。 抱歉,混了多年都沒遇到過。工程師正常都是 995 起跳,早回家就是反應在績效。 外商或許工時正常點? 但是薪資真的沒遇過相對高的。 (例如 Amazon,微軟 談過 工程師薪資也就一般) 自己待改善: 平時晚上都沒有很認真準備面試,很多基本演算法與數學都忘了細節。 Leetcode 沒在定期做,常常題目看過,大致知道怎麼做,但寫得不順。 機器學習,常常業務目標不同,做法會完全不同, 雙方沒意識此問題,會很難展示專業匹配程度。 --------------------- 以上 ※ 編輯: DrTech (27.44.120.163 中國), 08/11/2019 11:55:48
yamakazi: 稅前百萬人民幣在中國一線公司也算是中層管理人員的薪水 08/11 11:55
yamakazi: 了吧 08/11 11:55
DrTech: 資深工程師,還是有機會到百萬的。看個人背景。 08/11 11:56
DrTech: 不一定要管理職缺打績效那種,才有機會百萬。 08/11 11:57
loadingN: 爽的都在國企 08/11 11:57
DrTech: 國企也分蠻多種的。之前有個做ATM的國企,也是到談薪水 08/11 11:58
DrTech: 才發現,雙方薪資期望差太多。浪費不少時間面試。 08/11 11:59
DrTech: 年薪不到50萬。國企通常很難談高薪是真的。 08/11 11:59
chter: 閱 08/11 12:06
BeardSmallGG: 推 08/11 12:29
MOONY135: 現在大陸這樣 不是過去的好時機點吧 08/11 13:28
ouryouth: 感謝經驗 對nlp有興趣 08/11 13:50
oopFoo: 推,漲見識了 08/11 20:27
descent: 感謝分享 08/11 21:18
hanyi0923: 那邊工時真的很長QQ 08/11 21:18
cliffk321: 在大陸年薪百萬人民幣通常都是管理層了,By the way我 08/11 23:53
cliffk321: 現在在微軟蘇州知識圖譜,年薪百萬台幣還是挺容易的 08/11 23:53
atpx: 很有意思, 推分享 08/12 00:29
atpx: 原po在台灣就是年薪2百等級了, 只百萬台幣沒必要去對岸 08/12 00:30
Murasaki0110: ms台灣剛畢業就破百了...對岸有這麼慘? 08/12 01:55
DrTech: 可能看部門吧。MS 蘇州,Azure ML support , 最近在電話一 08/12 08:13
DrTech: 面的時候,明確說明該職缺 面得好的活,年薪55萬RMB,不能 08/12 08:13
DrTech: 再高了。 08/12 08:13
cliffk321: 趁機來給大家科普一下,MS應屆生的價格去年是31w人民幣 08/12 09:09
cliffk321: ,等級是SDE,原po大概是被歸在SDE2這個Level,MS到sen 08/12 09:09
cliffk321: ior比較困難,我有個同事美國谷歌回來才被歸到senior。 08/12 09:09
cliffk321: 最後,我還沒畢業,但看今年的形式我能拿到的包應該是 08/12 09:09
cliffk321: 大於31萬的。對有工作經歷的人來說目前來大陸可能不是 08/12 09:09
cliffk321: 件好事,因為目前的大陸軟體人才很多,原Po的面試內容 08/12 09:09
cliffk321: 跟應屆生其實差不多,很難拿到想要的薪資。之後我也發 08/12 09:10
cliffk321: 一篇最近在大陸校招的文章給大家分享。 08/12 09:10
gbd37: 長知識 08/12 09:37
del680202: 我同事今年才被中國挖去 total package 200萬人民幣... 08/12 09:43
aszx4510: 推 感謝分享 08/12 11:14
oopFoo: 感覺兩岸薪水差距越來越大 08/12 21:04
Toyzer: ㄌ 08/12 21:40
elements: ms 升 senior 不難阿,但大概也不大包就是了 08/13 01:41
previa: del680202 是哪家公司? 08/13 12:09
RadiationXen: 推分享 08/14 12:27
eopXD: 推 感謝分享 08/14 17:35

推薦文章