一文教你如何快速高效閱讀Paper(碩士生版)

 2019-02-22 13:02:20.0

前言

論文閱讀一直是科研過程中至關重要的一環,如何收集論文,快速選取和課題匹配的論文,高效地把握論文核心思想是每個科研人員的必備素養,也是每個科研萌新(碩士研究生)苦惱的問題。

臺灣國立清華大學的彭明輝教授曾出版過一份《研究生手冊》,其中關於論文閱讀的內容詳實精彩,將其整理如下,希望對大家有所幫助。

Paper從哪來

  • 詢問導師和同門師兄的意見,因爲他們在這個領域比你經驗豐富,可以推薦經典論文給你。

  • 在Google Scholar上運用合適的關鍵詞收集30篇左右論文(高引用量論文優先收集)。

  • 高引論文的參考文獻。

Paper怎麼讀

期刊論文和大學的課本截然不同。大學的課本是循次漸進地從最基本的知識背景逐步交代出整套系統知識,只要你逐頁讀下去,就可以整本都讀懂。但是期刊論文是沒頭沒尾的十幾頁文獻,只交代最核心的創意,並援引許多其它論文的研究成果(但只註明文獻出處,而完全沒有交代其內容)。

因此,要讀懂一篇論文,一定要同時讀懂數篇或十數篇被援引的其它論文。偏偏,這十幾篇被援引的論文又各自援引十數篇其它論文。因此,相對於大學部的教科書而言,期刊論文是一個極端沒有系統的知識,必須要靠讀者自己從幾十篇論文中擷取出相關的片段,自己組織成一個有系統的知識,然後纔有辦法開始閱讀與吸收。要培養出這種自己組織知識的能力,需要在學校靠着大量而持續的時間去摸索、體會,而不可能只利用業餘的零星時間去培養。

因此,學士和碩士最大的差別,就是:學士只學習過吸收系統知識的能力(也就是讀別人整理、組織好的知識,典型的就是課本);但碩士則學習過自己從無組織的知識中檢索、篩選、組織知識的能力。

你必須要有能力逐篇分析出所有相關期刊論文的優點與缺點,以及自己的研究成果的優點與缺點,然後再拿他們來做比較,總結出你的論文的優點和缺點(限制)。但是,好的期刊論文往往是國外著名學府的名師和一流的博士生共同的研究成果,假如你要在鎖定的應用場域上打敗他們,突出自己的優點,這基本上是一個極端困難的挑戰。即使只是要找出他們的缺點,都已經是一個相當困難的工作了。

一個大學畢業生,四年下來都是假定「課本是對的」這樣地學下來的,從來沒有學習如何分析課本知識的優缺點,也就是隻有理解的能力,而沒有批判的能力。碩士生則必須要有對一切既有進行精確批判的能力。但是,這個批判並非個人好惡或情緒化的批判,而是真的找得到充分理由去支持的批判。這個批判的能力,讓你有能力自己找到自己的優、缺點,因此也有機會自己精益求精。

一般來講,好的期刊論文有較多的創意。雖然讀起來較累,但收穫較多而深入,因此比較值得花心思去分析。讀論文之前,參考SCI Impact Factor 及導師、學長的意見是必要的。

一篇期刊論文,主要分成三個部分。

1. Abstract:

說明這篇論文的主要貢獻、方法特色與主要內容。必須要學會只看 Abstract 和Introduction便可以判斷出這篇論文的重點和你的研究有沒有直接關聯,從而決定要不要把它給讀完。假如你有能力每三十篇論文只根據摘要和簡介便能篩選出其中最密切相關的五篇論文,你就比別人的效率高五倍以上。以後不管是做事或做學術研究,都比別人有能力從更廣泛的文獻中挑出最值得參考的資料。

2. Introduction:

Introduction 的功能是介紹問題的背景和起源,交代前人在這個題目上已經有過的主要貢獻,說清楚前人留下來的問題,以及在這個背景下這篇論文想解決的問題和它的意義。對初學的學生而言,從這裏可以瞭解以前研究的概況。通常我會建議初學的學生,對你的題目不熟時,先把跟你題目可能相關的論文收集個 30~40篇,每篇都只讀Abstract 和 Introduction,而不要讀 Main Body(本文),只在必要時稍微參考一下後面的 Illustrative examples和 Conclusions,直到你能回答下面這四個問題:

  • (2A)在這領域內最常被引述的方法有哪些?

  • (2B)這些方法可以分成哪些主要派別?

  • (2C)每個派別的主要特色(含優點和缺點)是什麼?

  • (2D)這個領域內大家認爲重要的關鍵問題有哪些?有哪些特性是大家重視的優點?有哪些特性是大家在意的缺點?這些優點與缺點通常在哪些應用場合時會比較被重視?在哪些應用場合時比較不會被重視?

問題是,你怎麼去找到這最初的30~40篇論文?有一種期刊論文叫做review paper,專門在一個題目下面整理出所有相關的論文,並且做簡單的回顧。你可以在搜尋 Compendex 時在 keywords 中加一個review而篩選出這類論文。然後從相關的數篇review paper 開始,從中根據 title 與 Abstract 找出你認爲跟你研究題目較相關的30~40篇論文。

通常只要你反覆讀過該領域內30~40篇論文的Abstract 和 Introduction,你就應該可以從Introduction的評論中回答(2A)和(2B)這兩個問題。尤其要記得,當你閱讀的目的是要回答(2A)和(2B)這兩個問題時,你一定要先挑那些 Introduction寫得比較有觀念的論文念(很多論文的Introduction 寫得像流水帳,沒有觀念,這種論文剛開始時不要去讀它)。假如你讀過30~40篇論文的 Abstract 和 Introduction之後,還是回答不了(2C),先做下述的工作。

你先根據(2A)的答案,把這領域內最常被引述的論文找齊,再把他們根據(2B)的答案分成派別,每個派別按日期先後次序排好。然後,你每次只重新讀一派的 Abstract 和 Introduction(必要時簡略參考內文,但目的只是讀懂Introduction內與這派有關的陳述,而不需要真的看懂所有內文),照日期先後讀 ,讀的時候只企圖回答一個問題:這一派的創意與主要訴求是什麼?這樣,你逐派逐派地把每一派的Abstract 和 Introduction 給讀完,總結出這一派主要的訴求 、方法特色和優點(每一篇論文都會說出自己的優點,仔細讀就不會漏掉)。

其次,你再把這些論文拿出來,但是隻讀Introduction,認真回答下述問題:每篇論文對其它派別有什麼批評?然後你把讀到的重點逐一記錄到各派別的「缺點欄內。


通過以上程序,你就應該可以掌握到(2A)、(2B)和(2C)三個問題的答案。這時你對該領域內主要方法、文獻之間的關係算是相當熟稔了,但是你還是隻仔細讀完Abstract 和 Introduction而已,內文則只是籠統讀過。


這時候,你已經掌握到這領域主要的論文,你可以用這些論文測試看看你用來搜尋這領域論文的 keywords 到底恰不恰當,並且用修正過的 keywords 再搜尋一次論文,把這領域的主要文獻補齊,也把原來30~40篇論文中後來發現關係較遠的論文給篩選掉,只保留大概20篇左右確定跟你關係較近的文獻。如果有把握,可以甚至刪除一兩個你不想用的派別(要有充分的理由),只保留兩、三個派別(也要有充分的理由)繼續做完以下工作。


然後你應該利用(2C)的答案,再進一步回答一個問題(2D):


  • 這個領域內大家認爲重要的關鍵問題有哪些?

  • 有哪些特性是大家重視的優點?

  • 有哪些特性是大家在意的缺點?

  • 這些優點與缺點通常在哪些應用場合時會比較被重視?

  • 在哪些應用場合時比較不會被重視?


然後,你就可以整理出這個領域(研究題目)主要的應用場合,以及這些應用場合上該注意的事項。


最後,在你真正開始念論文的 main body 之前,你應該要先根據(2A)和(2C)的答案,把各派別內的論文整理在同一個檔案夾裏,並照時間先後次序排好。然後依照這些派別與你的研究方向的關係遠近,一個派別一個派別地逐一把各派一次唸完一派的 main bodies。


3. Main body(含simulation and/or experimental examples):


在你第一次有系統地念某派別的論文 main bodies 時,你只需要念懂:


  • (3A)這篇論文的主要假設是什麼(在什麼條件下它是有效的),並且評估一下這些假設在現實條件下有多容易(或多難)成立。愈難成立的假設,愈不好用,參考價值也愈低。

  • (3B)在這些假設下,這篇論文主要有什麼好處。

  • (3C)這些好處主要表現在哪些公式的哪些項目的簡化上。至於整篇論文詳細的推導過程,你不需要懂。除了三、五個關鍵的公式(最後在應用上要使用的公式,你可以從這裏評估出這個方法使用上的方便程度或計算效率,以及在非理想情境下這些公式使用起來的可靠度或穩定性)之外,其它公式都不懂也沒關係,公式之間的恆等式推導過程可以完全略過去。假如你要看公式,重點是看公式推導過程中引入的假設條件,而不是恆等式的轉換。

  • (3D)這一派主要的缺點有哪些。


但是,在你開始根據前述問題念論文之前,你應該先把這派別所有的論文都拿出來,逐篇粗略地瀏覽過去(不要勉強自己每篇或每行都弄到懂,而是輕鬆地讀,能懂就懂,不懂就不懂),從中挑出容易念懂的 papers,以及經常被引述的論文。然後把這些論文按照時間先後次序依序念下去。記得:你念的時候只要回答(3A)、( 3B)、(3C)三個問題就好,不要念太細。


這樣唸完以後,你應該把這一派的主要發展過程,主要假設、主要理論依據、以及主要的成果做一個完整的整理。其次,你還要在根據(2D)的答案以及這一派的主要假設,進一步回答下一個問題:(3D)這一派主要的缺點有哪些。最後,根據( 3A)、(3B)、(3C)、(3D)的答案綜合整理出:這一派最適合什麼時候使用,最不適合什麼場合使用。  


當你是生手的時候,你要評估一個方法的優缺點時,往往必須要參考它Examples。但是,要記得:老練的論文寫作高手會故意只 present 成功的案例而遮掩失敗的案例。所以,simulation examples and/or experiments 很棒不一定表示這方法真的很好。你必須要回到這個方法的基本假設上去,以及他在應用時所使用的主要公式(resultant equations)去,憑自己的思考能力, 並且參考(2C)和(2D)的答案,自己問問看:當某某假設在某些實用場合上無法成立時,這個方法會不會出什麼狀況?猜一猜,預測一下這個方法應該會在哪些條件下(應用場合)表現優異,又會在哪些條件下(應用場合)出狀況?根據這個猜測再檢驗一次simulation examples and/or experiments,看它的長處與短處是不是確實在這些examples 中充分被檢驗,且充分表現出來。


那麼,你什麼時候才需要弄懂一篇論文所有的恆等式推導過程,或者把整篇論文細細讀完?NEVER!你只需要把確定會用到的部分給完全搞懂就好,不確定會不會用到的部分,只需要瞭解它主要的點子就夠了。


碩士生和大學生最主要的差別:大學生讀什麼都必須要從頭到尾都懂,碩士生只需要懂他用得着的部分就好了!大學生因爲面對的知識是有固定的範圍,所以他那樣念。碩士生面對的知識是沒有範圍的,因此他只需要懂他所需要的細膩度就夠了。碩士生必須學會選擇性的閱讀,而且必須鍛煉出他選擇時的準確度以及選擇的速度,不要浪費時間在學用不着的細節知識!多吸收點子比較重要,而不是細部的知識。


大學畢業後(不管是念碩、博士或工作),可以參考的資料都沒有秩序地交錯成一團,而且永遠都讀不完。用大學生的心態讀書,結果一定時間永遠不夠用。因此,每次讀論文都一定要帶着問題去讀,每次讀的時候都只是圖回答你要回答的問題。因此,一定是選擇性地閱讀,一定要逐漸由粗而細地一層一層去了解。上面所規劃的讀論文的次序,就是由粗而細,每讀完一輪,你對這問題的知識就增加一層。根據這一層知識就可以問出下一層更細緻的問題,再根據這些更細緻的問題去重讀,就可以理解到更多的內容。因此,一定是一整批一起讀懂到某個層次,而不是逐篇逐篇地整篇一次讀懂。


這樣讀還有一個好處:第一輪讀完後,可以根據第一輪所獲得的知識判斷出哪些論文與你的議題不相關,不相關的就不需要再讀下去了。這樣纔可以從廣泛的論文裏逐層準確地篩選出你真正非懂不可的部分。不要讀不會用到的東西,白費的力氣必須被極小化!其實,絕大部分論文都只需要瞭解它的主要觀念(這往往比較容易),而不需要了解它的詳細推導過程(這反而比較費時)。


其次,一整批一起讀還有一個好處:同一派的觀念,有的作者說得較易懂,有的說得不清楚。整批讀略過一次之後,就可以規劃出一個你以爲比較容易懂的閱讀次序,而不要硬碰硬地在那裏撞牆壁。你可以從甲論文弄懂乙論文的一個段落,沒人說讀懂甲論文只能靠甲論文的信息。所以,整批閱讀很像在玩跳棋,你要去規劃出你自己閱讀時的最省力路徑。


大學部學生讀東西一定要循規蹈矩,你還沒修過機械視覺相關課程之前可能也只好循規蹈矩地逐行去念。但是一旦修過機械視覺相關課程,許多論文中沒被交代的段落你也已經可以有一些屬於你的想象(雖然有可能猜錯,尤其剛開始時經常猜錯,但沒關係,下面詳述)。


這些想象往往補足論文跳躍處最快速的解決方案。其實,一個大學畢業生所學已經很多了,對許多都可以有一個不太離譜的想象能力。但是大部分學生卻根本不敢去想象。我讀論文遠比學生快,分析遠比學生深入,主要的是我敢想象與猜測,而且多年訓練下來想象與猜測的準確度很高。所以,許多論文我根本不是讀懂的,而是猜對了!


假如猜錯了怎麼辦?不用怕!猜完以後要根據你的猜測在論文裏找證據,用以判斷你的猜測對不對。猜對了,就用你的猜測(其實是你的推理架構)去吸收作者的資訊與創意(這會比從頭硬生生地去遷就作者的思路輕鬆而容易);猜錯了,論文裏會有一些信息告訴你說你錯了,而且因爲猜錯所以你讀到對的答案時反而印象更深刻。


Paper如何寫


  • 論文的主要內容是敘述一套方法在一個特定場合中的應用。

  • 這套方法必須要有所創新或突破,並因而對學術界有所貢獻。因此,它或者是解決既有問題的新方法,或者是既有方法的新應用,或者是以一個新的方法開啓一整片新的應用領域。

  • 在論文中,你必須要有能力提出足夠的證據來讓讀者信服說:針對這個應 用場合,你所提出來的方法確實有比文獻中一切既有方法更優越之處。

  • 此外,你必須要能清楚指出這個方法在應用上的限制,並且提出充分證據來說服讀者:任何應用場合,只要能夠滿足你所提出來的假設(前提)條件,你的方法就一定適用,而且你所描述的優點就一定會存在。

  • 你還必須要在論文中清楚指出這個方法的限制和可能的缺點(相對於其它文獻上的既有方法,或者在其它應用場合裏)

  • 行文風格上,它是一篇論證嚴謹,邏輯關係清晰,而且結構有條理的專業論述。也就是說,在敘述你的方法的過程時,你必須要清清楚楚地交代這個方法的應用程序以及所有仿真或實驗結果的過程,使得這個專業領域內的任何讀者,都有辦法根據你的描述,在他的實驗室下複製出你的研究成果,以便確定你的結論確實是可以在任何時間、任何地點、任何人都具有可重複性(可重複性是科學的根本要求)。

  • 而且,你對這個方法的每一個步驟都必須要提供充分的理由說明爲什麼非如此不可。

  • 最後,你的論文必須要在適當位置清楚註明所有和你所研究之題目相關的文獻。而且,你必須要記得:只要是和你所研究的問題相關的學術文獻(尤其是學術期刊論文),你都有必要全部找出來(如果漏掉就是你的過失),仔細讀過。假如你在學位論文口試時,有口試委員指出有一篇既有文獻,在你所討論的問題中處理得比你的方法還好,這就構成你論文無法及格的充分理由。


第2款所謂對學術界的貢獻,指的是:把你的所有研究成果扣除掉學術界已經發表過的所有成果(不管你實際上有沒有參考過,沒有參考過也算是你的重大過失),剩下的就是你的貢獻。


總結


首先需要通過關鍵詞收集論文,泛讀論文來回答下面四個問題:


  • 在這領域內最常被引述的方法有哪些?

  • 這些方法可以分成哪些主要派別?

  • 每個派別的主要特色(含優點和缺點)是什麼?

  • 這個領域內大家認爲重要的關鍵問題有哪些?有哪些特性是大家重視的優點?有哪些特性是大家在意的缺點?這些優點與缺點通常在哪些應用場合時會比較被重視?在哪些應用場合時比較不會被重視?


在此基礎上,需要細讀一些論文,知道這個領域有哪些派別,及其對應的主要方法的優缺點,明白各個方法的適用和不適用場景,並試圖提出自己的方法,以突破或改善問題瓶頸。


參考資料


怎樣閱讀論文(臺灣彭明輝):

https://blog.csdn.net/peonyding/article/details/39528381


如何有針對地高效地閱讀一篇學術論文?:

https://www.zhihu.com/question/23924014/answer/26470331


編輯:王菁

校對:呂豔芹

文章來源:機器之心