植基於詞彙分析方法探索電子商務主題網絡之研究ijcs.topco-global.com/WebSite/Articles/2011Vol3_No3_137_154.pdf ·...

18
2011 年,3 卷,3 期,137-154137 本研究運用詞彙分析及機會探索方法呈現電子商務顯著及潛藏之主題網絡結構,並探討專業詞庫在探勘 分析之運用效益。實驗共蒐整計 3,273 篇國內博碩士論文,結果顯示出國內電子商務研究主題多在探討各種 交易模式 ( 如交易市集、電子市場及線上購物 ) ,並強調其服務品質 ( 如顧客關係管理、信任 ) ;而潛藏之研 究則集中在資源整合 ( 如企業資源規劃、電子資料交換 ) 及資訊科技應用 ( 如行動代理人、公開金鑰、認證簽 章及資料探勘 ) 等主題。另植基於文字探勘技術所建構之專業詞庫,確可有效改善斷詞系統之短詞問題,且 可萃取出較符合研究主題之詞彙。此外,本研究將電子商務發展時期區分為三階段,以觀察並探討電子商務 研究主題之變化趨勢。希望藉由本研究結果,可有助於瞭解學界於電子商務研究資源之投入,或提供企業發 展電子商務時之參考。 關鍵字:電子商務、文字探勘、機會探索、 KeyGraph 植基於詞彙分析方法探索電子商務主題網絡之研究 通訊作者陳良駒為國防大學管理學院資訊管理學系副教授,地址:11258 台北市北投區中央北路二段 70 號,電話:+886-2- 28986600 604971E-mail[email protected]。作者顧亦平為國防大學管理學院資訊管理學系碩士,地址:23146 新店市中興路 1 288 5 1 樓,電話:+886-920-751189E-mail[email protected]論文編號:IJCS2011007 收稿 2011 1 21 日→第一次修正 2011 4 16 日→第二次修正 2011 5 1 日→第三次修正 2011 6 10 →第四次修正 2011 7 27 日→正式接受 2011 9 2 陳良駒 國防大學 顧亦平 國防大學

Transcript of 植基於詞彙分析方法探索電子商務主題網絡之研究ijcs.topco-global.com/WebSite/Articles/2011Vol3_No3_137_154.pdf ·...

Page 1: 植基於詞彙分析方法探索電子商務主題網絡之研究ijcs.topco-global.com/WebSite/Articles/2011Vol3_No3_137_154.pdf · 以作者共引分析(Author Co-citation Analysis)

商 略 學 報 2011 年,3 卷,3 期,137-154。

137

本研究運用詞彙分析及機會探索方法呈現電子商務顯著及潛藏之主題網絡結構,並探討專業詞庫在探勘

分析之運用效益。實驗共蒐整計 3,273 篇國內博碩士論文,結果顯示出國內電子商務研究主題多在探討各種

交易模式 ( 如交易市集、電子市場及線上購物 ),並強調其服務品質 ( 如顧客關係管理、信任 );而潛藏之研

究則集中在資源整合 ( 如企業資源規劃、電子資料交換 ) 及資訊科技應用 ( 如行動代理人、公開金鑰、認證簽

章及資料探勘 ) 等主題。另植基於文字探勘技術所建構之專業詞庫,確可有效改善斷詞系統之短詞問題,且

可萃取出較符合研究主題之詞彙。此外,本研究將電子商務發展時期區分為三階段,以觀察並探討電子商務

研究主題之變化趨勢。希望藉由本研究結果,可有助於瞭解學界於電子商務研究資源之投入,或提供企業發

展電子商務時之參考。

關鍵字:電子商務、文字探勘、機會探索、KeyGraph。

植基於詞彙分析方法探索電子商務主題網絡之研究

通訊作者陳良駒為國防大學管理學院資訊管理學系副教授,地址:11258 台北市北投區中央北路二段 70 號,電話:+886-2-28986600 轉 604971,E-mail:[email protected]。作者顧亦平為國防大學管理學院資訊管理學系碩士,地址:23146 新店市中興路 1 段 288 巷 5 號 1 樓,電話:+886-920-751189,E-mail:[email protected]

論文編號:IJCS2011007

收稿 2011 年 1 月 21 日→第一次修正 2011 年 4 月 16 日→第二次修正 2011 年 5 月 1 日→第三次修正 2011 年 6 月 10 日

→第四次修正 2011 年 7 月 27 日→正式接受 2011 年 9 月 2 日

陳良駒國防大學

顧亦平國防大學

Page 2: 植基於詞彙分析方法探索電子商務主題網絡之研究ijcs.topco-global.com/WebSite/Articles/2011Vol3_No3_137_154.pdf · 以作者共引分析(Author Co-citation Analysis)

International Journal of Commerce and Strategy2011, Vol. 3, No. 3, 137-154

138

The Study on Exploring Electronic Commerce Topics Network Based on the Term Analysis

Liang-Chu ChenNational Defense University

Yi-Ping KuNational Defense University

Paper No.: IJCS2011007

Received January 21, 2011→First Revised April 16, 2011→Second Revised May 1, 2011→Third Revised June 10, 2011→Fourth Revised July 27, 2011→Accepted September 2, 2011

The Corresponding Author, Liang-Chu Chen, is an Associate Professor in the Department of Information Management, Management College, National Defense University, Address: No. 70, Sec. 2, Zhongyang North Rd., Beitou Dist., Taipei City 11258, Taiwan, Tel: +886-2-28986600 ext. 604971, E-mail: [email protected] Yi-Ping Ku, is a Master from the Department of Information Management, Management College, National Defense University, Address: 1F., No. 5, Lane 288, Sec. 1, Zhongxing Rd., Xindian Dist., New Taipei City 23146, Taiwan, Tel: +886-920-51189, E-mail: [email protected]

This paper uses term-based analysis and chance discovery (i.e. KeyGraph) method to present the topic network of the electronic commerce (EC) research and explore the effectiveness of using the professional lexicon in EC field. This research collected 3,273 articles from theses and dissertations in Taiwan, the result shows that most domestic EC studies are focused on a variety of transaction modes (e.g., e-Market, online shop) and emphasis on their service quality (e.g., customer relationship management, trust). The research behind those topics focus on the topic of resource integration (e.g., enterprise resource planning, electronic data exchange) and the application of information technology (e.g., mobile agent, public key infrastructure, signature verification and data mining). In addition, the construction of professional lexicon based on text mining can surely improve the short term problems in the Chinese word segmentation system and it also can extract the terms that fit the research subject effectively. This study also divides the EC topics into three stages and examines the tendency of EC. The result of this study may be helpful for the investment of the academic researchers or a reference basis of the enterprises when they intend to participate in EC.

Key Words: Electronic Commerce, Text Mining, Chance Discovery, KeyGraph.

Page 3: 植基於詞彙分析方法探索電子商務主題網絡之研究ijcs.topco-global.com/WebSite/Articles/2011Vol3_No3_137_154.pdf · 以作者共引分析(Author Co-citation Analysis)

2011 L.-C. Chen and Y.-P. Ku 139

緒論

近 年 來 政 府 為 建 立 國 內 電 子 商 務 (Electronic

Commerce) 的基礎環境,分別訂定「國家資通訊發展方

案」、「數位台灣計畫」及「行動台灣計畫」等大型方

案,其推行成效分別在世界經濟論壇 (World Economic

Forum, WEF) 公布的 2006-2007 年「網路整備度」評

比中,排名世界第 13;另於國際電信聯盟 (International

Telecommunication Union, ITU)「數位機會」之評比

中,我國更名列世界第 7,不僅顯示政府對電子基礎建

設的重視與資源的投入,更證實我國於電子商務中深具

發展潛力 ( 經濟部商業司,2007)。而在學術界,電子

商務亦受到相當程度之重視。如各大專院校均針對電子

商務相關主題成立系所或研究中心;國內部份學者亦針

對電子商務相關的論文進行內容分析,以建構電子商務

主題之發展架構 ( 方文昌等,2003;黃旭男等,2003;

廖述賢,2007);國外學者 Lee et al. (2007) 從 1996-

2005 年間的 1,103 篇電子商務研究論文中,探究電子

商務在主題、分析層級與方法上的多樣性發展,均可顯

示學界對電子商務研究投入之豐富資源。

綜上所述,我國已具有良好之電子商務基礎環境,

學術界亦有良好之研究資源,故如何於繁雜之電子商務

研究主題中,取得符合企業經營及學術研究之機會,並

加以運用,已成為當前的重要課題。然電子商務主題

具多元性及複雜性,學者多以主觀分類方式制訂電子商

務類別及範疇 (Kauffman and Walden, 2001; Ngai and

Wat, 2002; Wareham et al., 2005),較缺乏以文件內容

進行詞彙探勘的動態主題關聯分析。余國訓等 (2011)

以作者共引分析 (Author Co-citation Analysis) 方法探

索國外 SSCI 及 SCI 資料庫內容中共同引用之特性,呈

現當代電子商務研究之智識結構,同時也揭露電子商務

研究的五項重要議題。但作者共引的特性在於分析作

者的強聯繫關係,以聚焦於該領域發展的重要因素,

對於潛在的議題則無法有效發掘。機會探索 (Chance

Discovery) 是學者 Ohsawa 等人於 1998 年提出的新興

研究議題,透過詞彙之間的關係轉化成具結構性的視覺

化圖形,以呈現「稀有 ( 低頻率 )」但「具重要結構」

的關鍵概念。目前已應用於電子佈告欄 BBS (Seo et al.,

2006)、專利資料庫 (Li et al., 2009)、產業分析 (Hong,

2009) 等多個領域中,在企圖發現低頻次但卻潛在關鍵

的概念關係中,均有不錯的研究成果。但相關概念尚未

應用於電子商務主題探索之研究。

本研究將運用文字探勘 (Text Mining) 技術,整合機

會探索等動態分析方法,透過實驗分析專業詞庫於文件

中之運用效益,並以圖像視覺化 KeyGraph 工具呈現電

子商務關鍵研究主題及其網絡關係,藉以尋求國內電子

商務研究可能之潛藏知識結構,進而提供學界投入電子

商務研究資源,或企業於發展電子商務時之參考依據。

文獻探討

電子商務研究主題

從通訊的觀點來說,電子商務被視為分享企業

資訊、維持企業關係及從事企業間交易的一種手段

(Zwass, 1996),電子商務的發展具多樣化的研究主題,

包括技術面 (安全、代理人等 )、企業支援面 (廣告行銷、

策略規劃、稅務等 )、應用面 ( 網路銀行、線上購物、

顧客關係管理等 ) 及其它 ( 隱私權、信任 ),每一類研

究主題均具有其發展性。

許多學者針對電子商務研究主題進行分類研究。

國外學者部份如:Zwass (1996) 提出包括三個構面 ( 基

礎建設、服務、產品與結構 ) 及七個子主題的層級式

框架,該作者於 2003 年進一步提出電子商務的 5C 概

念, 包 括 商 務 (Commerce)、 協 同 (Collaboration)、

通 訊 (Communication)、 聯 結 (Connection) 及 運 算

(Computation) 等 模 式 (Zwass, 2003)。Kauffman and

Walden (2001) 以經濟觀點探究電子商務發展主題,提

出一個整合技術、流程、產品、市場及巨觀經濟等五構

面的概念性架構。Ngai and Wat (2002) 蒐集 1993-1999

年間的電子商務文章,以彙總方式將電子商務研究區分

為應用、技術、支援與導入及其他等四大類。Wareham

et al. (2005) 則認為 B2B (Business-to-Business)、B2C

(Business-to-Customer)、策略發展及技術採用是電子商

務研究中四個重要的研究主題。Turban et al. (2006) 則

建議電子商務研究架構應包括基礎建設 (Infrastructure)、

支援服務 (Support Services) 及應用 (Applications) 三個

面向。

國內學者方文昌等人 (2003)以Ngai and Wat (2002)

的架構為基礎,蒐集國內 2000-2003 年間發表的電子

商務期刊與研討會論文共 278 篇進行分析與比較。黃旭

男等人 (2003) 針對 81-89 學年度期間的「電子商務」

博碩士論文進行內容分析,同時整合多位學者之概念建

議,將電子商務研究區分為技術面、應用面、支援與實

行、總體面四大類。廖述賢 (2007) 回顧 1995-2005 十

年間的電子商務研究,並區分為基礎研究 (Framework/

Page 4: 植基於詞彙分析方法探索電子商務主題網絡之研究ijcs.topco-global.com/WebSite/Articles/2011Vol3_No3_137_154.pdf · 以作者共引分析(Author Co-citation Analysis)

140 SeptemberInternational Journal of Commerce and Strategy

Survey)、智慧型代理人 (Intelligent Agent)、資通技

術 (Information and Communication Technologies)、

電 子 資 料 交 換 (Electronic Data Interchange)、 統 計

方 法 (Statistics Methods) 及 塑 模 方 法 論 (Modeling

Methodology) 六大主題,並建議後續學者可結合不同

的科技以分析電子商務之運用與研究。郭英峰、游景文

(2008) 彙總相關學者之研究提出電子商務主題分類表,

發現「資訊科技與基礎建設」、「應用產業特定主題」

及「支援與實行」等三類為電子商務研究領域之主軸,

其結果與 Turban et al. (2006) 之觀察類似。

綜合前述,國內外許多學者雖投入電子商務主題分

類之研究,然其設計的架構多以內容分析或主觀歸納的

方式進行文獻彙總,偏向於以作者為觀點的靜態分類;

然而,對於植基於文件內容的電子商務動態性主題關聯

性之探討卻非常欠缺。余國訓等 (2011) 以作者共引分

析方法探索國外 1996-2008 年間電子商務研究結構之

特性,除呈現作者共引的社會網絡關係外,也透過因素

分析發現當代電子商務的五項研究議題,包括消費者行

為、資訊科技與電子市集、推薦系統、電子資料交換實

行及電子市場之自我服務與顧客滿意度。該作者雖提出

一個以論文內容之共引關係所建構的學域知識結構,但

該方法卻不支援該知識領域潛在機會議題的發掘,而機

會探索之概念即為本研究企圖探索的核心問題。

文字探勘

知識探勘 (Knowledge Mining) 是擷取具潛在價值

及有用的規則、資訊或知識的過程。一般而言,知識探

勘可分為資料探勘 (Data Mining) 與文字探勘兩大類。

傳統的資料探勘技術主要係針對結構化的資料 ( 如表

格 ) 進行分析,忽略隱含大量資訊內容的半結構化或非

結構化的資料 ( 如文件 )。而文字探勘技術則以自然語

言處理工具在非結構化文件中進行文字樣版 (Patterns)

萃取工作,包括從文件中自動萃取新的、未知的、有

用的、隱晦的資訊,以利知識探索之發展 (Delen and

Crossland, 2008)。

一般而言,文字探勘的主要工作包括文件擷取、

特徵詞斷詞與篩選、特徵詞分析及視覺化結果等步驟

(Chen, 2001)。「文件擷取」為選定探勘主題,將大量

文件資料進行彙整收集;「特徵詞斷詞與篩選」係將文

件資料中的文字詞性依據相關規則進行截斷與組合,以

釐定具有重要意涵的文件特徵詞;「特徵詞分析」則透

過詞頻、詞共現或詞聚類等規則,建構文字結構之關係;

「視覺化結果」則以圖形工具展現相關分析成果。

文字探勘現已被廣泛應用於各式功能領域及應用

領域中。功能特性包含特徵詞關聯性發掘、文件叢集

分析、概念擷取、文件摘要、文件分類等 ( 袁立安,

2007);應用範疇則包括檔案學分群 (Kim and Lee,

2008)、疾病基因相關性 ( 吳欣達,2006)、產業新聞聚

類 (Ong et al., 2005) 及人才招募推薦 ( 黃國政,2006)

等。此外,鄭百勝 (2006) 透過關聯法則進行關鍵字分

析,並將結果以知識結構圖方式呈現,最後探討資訊管

理研究主題之發展歷程,也獲致豐碩的研究成效。

機會探索

機會探索目的在探索影響未來的現象或特徵,稱之

為「機會」,該詞涵蓋了機會 ( 令人滿意的影響 ) 或風

險 ( 潛藏的威脅 ) 兩個意涵 (Prendinger and Ishizuka,

2001)。產業界對於機會的探索及風險的避免均有很大

的興趣,因此在競爭激烈的商業環境中,多數企業積極

以「機會探索」概念進行利益獲取及規避損失 (王鼎元,

2007)。

機 會 探 索 是 延 伸 自 資 訊 擷 取 (Information

Retrieval)、 社 會 網 路 (Social Networks) 與 小 世 界

(Small World) 等基礎理論的新概念,其中小世界在探

討連結 (Connection) 的角色與重要性;而機會探索則

是小世界理論的一種實作方式。目前機會探索研究所使

用的方法及工具,大部分是採用 Ohsawa (1998) 等人

所提出的視覺化圖像工具 KeyGraph。該工具係以共現

方式來描述詞彙 (Terms) 與詞彙集群 (Group) 之間的關

係,特別針對高頻次詞彙 (High Frequency Terms) 與

低機率詞彙 (Low Probability Terms) 之間的弱聯繫關

係進行概念探索。此外,KeyGraph 可透過視覺化,自

大量的且複雜文章中發現一些未預期的新事件,並且從

中觀察出這些事件,是如何與經常性以及規律性的事件

相連,而這些事件也就是我們所希望探索出的「機會」

或「風險」。

機會探索的應用非常多元化。在產業分析方面,

Li et al. (2009) 運用機會探索技術發掘 DVD 專利資料

庫中具有「重要稀少性」特性的產品或技術,提供企

業在知識經濟時代快速發現具發展潛力的專利品項。

Hong (2009) 以紮根理論 (Grounded Theory) 為基礎,

整合專家知識與文字探勘的互動分析流程,建構質化

機會探索模式 (QCDM, Qualitative Chance Discovery

Model),該模式透過情境設計進一步整合相關副主題,

以浮現機會之情境;該作者藉由相關分析流程,探索台

Page 5: 植基於詞彙分析方法探索電子商務主題網絡之研究ijcs.topco-global.com/WebSite/Articles/2011Vol3_No3_137_154.pdf · 以作者共引分析(Author Co-citation Analysis)

2011 L.-C. Chen and Y.-P. Ku 141

灣光學產業 (Optical Industry)發展之結構與潛在機會。

在網路資源運用方面,崔維翰 (2007)蒐集部落格 (Blog)

相關資訊,發現「設計藝術」及「社會人文」是部落格

發展中的重要擴增機會議題。其他相關的應用面向則涵

蓋手機設計 ( 林木花,2005)、咖啡連鎖店 ( 陳素丹,

2007)、銀行破產結構 (Goda and Ohsawa, 2007) 及電

子佈告欄 BBS (Seo et al., 2006) 等。

而在研究議題探索方面,林木花等 (2008) 利用

KeyGraph 演算法探索 2006-2007 台灣網際網路研討會

之 96 篇會議論文內容,藉由詞彙與群集間之關係來決

定潛在主題的重要性,有助於網路教學與數位學習議

題的分析與推薦。楊筱芳等 (2008) 則以紮根理論的質

性研究流程來強化 KeyGraph 分析之脈絡,藉由整理

2005-2007 年間的 MIS Quarterly 期刊內容,發現該期

刊的論文發展主軸聚焦於「資訊科技」與「資訊系統」,

提供研究者有效辨識主題發展方向。李昱成 (2009) 以

2,400 篇主題為「軟實力」之中國大陸博碩士論文及期

刊為樣本,藉由機會探索工具 KeyGraph 來發掘中共

「軟實力」學域在不同時期與不同面向的發展現況與潛

藏的研究主題。然而,目前卻尚未見使用機會探索概念

及 KeyGraph 工具來探討電子商務主題發展之研究。

此外,為從探勘主體中有效獲得有意義的潛在議

題,Ohsawa and McBurney 於 2002 年提出機會探索

資料分析的雙螺旋模型 (Double-helix Model) 理論,

其指出在資料分析過程中 (如KeyGraph),係一人機 (指電腦 ) 互動,交互執行的過程,可稱為雙螺旋模型。其

第一個螺旋由操作者執行,如人對電腦下達指令及參

數,並解讀其執行結果,藉以發掘潛藏資料中的意涵。

第二螺旋則以電腦為主,如電腦將依據人所下達的指

令,執行資料的分類、運算、轉換、視覺化等過程。Li et al. (2009) 重新詮釋該螺旋模式設計,藉由電腦處理

資料的流程及人來解譯機會事件的循環,可以發現更多

潛在的線索 (Clues)。而Hong (2009)及楊筱芳等 (2008)學者提出結合專家知識與文字探勘技術互動的紮根理論

分析法,可以輔助雙螺旋模型的人機互動流程。

實驗架構與流程設計

研究設計說明

論文的每個「關鍵字」均代表該篇文章的研究主題

之一,而其每一個主題 ( 關鍵字 ) 之間,必然具有研究

意涵之關聯 ( 陳道輝 , 2003)。而林頌堅 (2010) 則認為

學者經常會在論文的標題及摘要中凸顯該學域裡重要的

研究主題及發展情形;謝盛文等 (2003) 學者宣稱論文

中的摘要及關鍵字最能夠代表該篇論文的研究主題;而

陳年興等 (2007) 學者則由標題、摘要、關鍵字等內容

中,萃取相關詞彙並視為研究主題,進行資訊管理領域

的知識結構及其演進模式的探討,達成顯著的成果。由

於學者具不同意見,故本研究分別設計實驗組,以探討

論文中「關鍵字」、「摘要」與「摘要運用詞庫」三者

模式之適切性。此外,在實驗中發現「電子商務」乙詞

為多數詞彙之連結詞,故於剔除該詞後再分析干擾詞之

影響範圍,以探討電子商務研究之關鍵主題及觀察其研

究趨勢。

實驗設計說明如下:

( 一 ) 實驗 A:以電子商務論文中的「關鍵字」欄位為

分析單元,經萃取及同義詞處理後,計

得關鍵詞共 5,380 組。

( 二 ) 實驗 B:以電子商務論文中的「摘要」為研究樣

本,再經 CKIP 系統 ( 中研院資訊科學

所 ) 斷詞及篩選處理後,總計取得 8,085

詞組。

( 三 ) 實驗 C:以電子商務論文中的「摘要」為研究樣

本,並應用本研究所產生之詞庫予以進

行斷詞,總計獲得詞彙為 4,018 組。

( 四 ) 實驗 D:將「電子商務」乙詞視為干擾詞,進行

剔除後重複進行上述三組實驗。

發展時期說明

此外,為觀察並探討電子商務研究主題之變化趨

勢,本研究於評估模式的適切性後,依據網路及科技發

展歷程,將電子商務區分為三個發展時期,分別探討不

同時期的研究主題重點及潛在機會議題。

發展時期之劃分原則說明如下:

網路發展期 (1995~2000)

1994 年 全 球 資 訊 網 協 會 (World Wide Web

Consortium,簡稱 W3C) 成立後,各式資訊與網路服

務的應用及線上交易的互動性電子商務型態需求不斷擴

增,直至 2000 年網路泡沫化,受到網路頻寬、傳輸品

質及電子付款機制均未成熟等因素,使電子商務無法穩

定持續的發展,但卻為其建立了厚實的基礎。

技術成長期 (2001~2005)

因應網路泡沫化消退、網路頻寬遽增及資通技術

的成熟,電子商務交易的便利及安全性均有大幅度的

Page 6: 植基於詞彙分析方法探索電子商務主題網絡之研究ijcs.topco-global.com/WebSite/Articles/2011Vol3_No3_137_154.pdf · 以作者共引分析(Author Co-citation Analysis)

142 SeptemberInternational Journal of Commerce and Strategy

提昇,依據經濟合作開發組織 (The Organization for

Economic Co-operation and Development, OECD) 的

統計資料,OECD 成員國的整體寬頻使用戶數,在

2001~2005 年成長了 4~5 倍之多。而台灣的寬頻用戶

亦在 2002~2005 年由 211 萬戶成長至 460 萬戶。另在

經濟部商業司的研究中亦顯示,國內線上購物市場規模

呈現近 40% 的穩定成長 ( 經濟部商業司,2007)。也就

是說,此階段的電子商務透過資通技術之成長,加速各

式商務服務之發展。

應用擴充期 (2006~2009)

Web 2.0 的概念雖於 1999 年即由 DiNucci 所提

出,但直至 2004 年才由 O'Reilly and Battelle 兩位學

者所正式宣告。但隨著資訊技術的成熟,遲至 2006 年

相關構想才逐漸實現,而 Web 2.0 盛行的結果,使網

路用戶量大幅提昇,根據研究機構國際數據資訊公司

(International Data Corporation, IDC) 於 2008 年 1 月

發表的 Web 2.0 亞太區域調查,發現有近 50% 的受訪

企業將 Web 2.0 視為重大商機,認為 Web 2.0 相關服務

與應用,對於企業內外部溝通與客戶服務乃至銷售,都

能有重大改善。

為觀察電子商務研究主題之變化歷程,本研究將依

據上述時期進行資料區分,並彙整說明主題變化之現象

及對於學界或業界在電子商務發展之建議。實驗說明如

下:將文章依電子商務三個發展時期進行區分,並以實

驗 A~D 中最適切之分析單元 ( 摘要斷字、論文關鍵字

及運用詞庫 ) 為實驗樣本,分別投入實驗,以觀察並探

討電子商務研究主題之變化趨勢。

研究架構

本實驗之目的在以動態文字探勘之技術,運用

KeyGraph 演算法為機會探索之分析工具,分別探討電

子商務研究主題在不同分析單元 ( 摘要斷字或論文關

鍵字 ) 與運用詞庫之差異,並發掘國內電子商務研究

主題與可能之潛藏研究機會。

研究架構可區分為五個階段 ( 如圖 1):

資料蒐集與區分階段

研究樣本係以國內博碩士論文為主,因國內目前以

國家圖書館建構之博碩士論文資料庫最為完整,另於探

討電子商務之研究現況與發展趨勢上,論文對於此領域

之研究方向具有一定之代表性 ( 陳禹辰等,1996)。為

圖 1 研究架構與流程

Page 7: 植基於詞彙分析方法探索電子商務主題網絡之研究ijcs.topco-global.com/WebSite/Articles/2011Vol3_No3_137_154.pdf · 以作者共引分析(Author Co-citation Analysis)

2011 L.-C. Chen and Y.-P. Ku 143

避免挑選過多不屬於電子商務之文獻,故僅以「電子商

務」為關鍵字,並針對「論文名稱」、「論文摘要」與

「關鍵詞」三個欄位進行不區分學年度之文獻蒐集,共

蒐整文獻樣本計 3,273 篇 ( 如表 1)。

詞庫建置階段

實驗中將擷取論文關鍵字欄位之詞彙為專業詞庫,

共計載入 6,352 個詞。由於國內論文對於關鍵字並無一

定標準可循,且研究中亦發現同一種概念可能由多種詞

彙表達。故於此階段會併同詞彙處理階段進行同義字與

相似詞之判斷。

本研究將運用陳道輝 (2003) 及陳年興等 (2007) 學

者所提出「關鍵字與摘要對應法」及「部分字串相符法」

來建構同義與相似詞。其中以「關鍵字與摘要對應法」

來處理同義詞,其主要概念為:若一篇論文的關鍵字出

現在該論文摘要中,且該關鍵字直接跟著一對括弧時,

則括弧中的英文字元即為該關鍵字的原始英文名稱,若

英文名稱相同則為同義字。例如:

D1:資料探勘 (Data Mining) →資料探勘原文為 Data Mining

D2:資料採礦 (Data Mining) →資料採礦原文為 Data Mining

則可知「資料探勘」與「資料採礦」為同義詞。

而利用「部分字串相符法」來處理相似詞之概念,

係透過兩個詞彙間具有共同文字之重複率,若其超過所

設定的門檻值,則可判定兩者為相似字。其方法說明如

下:

給定兩字串 m 與 n (m 之字串長度 > n),若滿足下

列所有條件,則 m 與 n 為相似關鍵字:

1. m 為 n 與另一字串 s 之組合,即 m = n + s 或 m = s + n

2. m, n 之字串長度均大於 t,t 為一常數

3. s 之字串長度不超過 l,l 為一常數

經陳道輝 (2003) 及陳年興等 (2007) 學者進行驗證

後,取 t = 4,l = 2 為「部分字串相符法」之門檻值可

獲得較佳之結果。舉例來說:

「個案研究」和「個案研究法」的文字重複率為 4 個字,

則「個案研究」和「個案研究法」為相似字。

「電子交易市場」和「電子交易市集」的重複率為 5 個字,

則「電子交易市場」和「電子交易市集」亦為相似字。

本研究即採用其篩選同義與相似詞之方法,建構電

子商務之專業詞庫。本實驗共計產生 665 組關鍵字群

組,其中包含有 2,121 個詞彙。

模式設計階段

本研究依據詞彙擷取之特性,設計「關鍵字為基」、

「斷詞-摘要為基」及「詞庫-摘要為基」三種實驗模

式,其中「關鍵字為基」係蒐集論文關鍵字詞彙,其詞

組間多採逗號或分號進行分隔,為便於處理,此階段將

統一以空白字元進行詞彙區隔;「斷詞-摘要為基」以

CKIP 系統 ( 中研院資訊科學所 ) 為擷取工具,於摘要

內容中獲取相關詞彙;「詞庫-摘要為基」則以詞庫建

置階段所產生之專業詞庫為來源,針對文章摘要進行斷

詞處理。

詞彙處理階段

為獲得較精準且具一致性之詞彙,本實驗於投入

KeyGraph 前,均先進行全半形轉換,各模式處理方式

如下:( 一 ) 針對「關鍵字為基」部份,直接以專業詞

庫進行同義及相似詞取代;( 二 )「斷詞-摘要為基」之

模式經過 CKIP 斷詞系統 ( 中研院資訊科學所 ) 處理後,

僅擷取相關名詞 ( 如普通名詞、專有名稱及代名詞等 ),

再以 2-Gram 的運算方式進行詞彙組合,接著進行同義

及相似詞取代;( 三 ) 另於「詞庫-摘要為基」模式中,

因已採專業詞庫斷字,故此階段將不做任何處理。

機會探索階段

本研究以 KeyGraph 演算法進行電子商務潛在主題

之分析,執行程序如下 (Llorà et al., 2004; Ohsawa and

McBurney, 2003):

(1) 文件前處理 (Document Preprocessing):包括文件及語

句中詞彙的整理,即指本階段之前的各項工作。

(2) 萃取高頻次詞彙 (Extracting High Frequency Terms):

年度 * 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 總計

文章篇數 1 2 18 58 92 280 405 410 395 363 340 322 284 283 20 3,273

表 1 電子商務博碩士論文研究蒐整結果

註:* 以畢業學年度 ( 西元年表示 ) 為基準,資料擷取至 2009/08/31 止。

Page 8: 植基於詞彙分析方法探索電子商務主題網絡之研究ijcs.topco-global.com/WebSite/Articles/2011Vol3_No3_137_154.pdf · 以作者共引分析(Author Co-citation Analysis)

144 SeptemberInternational Journal of Commerce and Strategy

為詞群 g 在句子 S 中發生的次數。

若該重要詞彙不屬於詞群集合 (w ∉ G),則將其納

入重要潛在關鍵詞彙集合 khk,亦即 w ∈ khk。

(5) 萃取關鍵連結 (Extracting Key Links):再將最後依

據權重值配合公式 (1) 之共現關係,連結兩個原本獨

立之詞群 ( 如圖 3),以發現詞彙間之「弱聯繫關係

(Weak Tie)」。也就是說,利用公式 (1) 的共現關係

計算方法,獲得高頻次詞彙 wi(wi ∈ Nhf) 與高重要性

詞彙 wj(w ∈ khk) 在同一句子中出現的次數,若發掘

某重要詞彙 wj 連結超過兩個以上的詞群,即可被視

為關鍵連結,同時被加入詞群集合 G。

(6) 萃取關鍵字 (Extracting Keywords) 詞群集合 G 中所有

關鍵連結依據共現頻率進行排序,篩選符合門檻值即

可認定為潛藏於文件內的關鍵字。

故本階段依據上述 KeyGraph 演算法流程進行詞頻

與共現分析之計算,並繪製詞彙關聯圖。如圖形中遇有

無義詞彙或詞彙數量過多,而造成無法判讀,則將依據

Ohsawa and McBurney (2002) 論點,調校系統參數並

請專家進行顯著與機會議題之辨識,若符合潛在機會意

涵則納入成果之分析。

實驗結果與分析

本實驗係運用 KeyGraph 工具,將國內與電子商務

相關之主題以圖形化方式呈現,希望發掘電子商務研究

主題之重點與可能之潛藏機會。分析結果如後:

詞頻統計

依據詞頻高低呈現不同模式下的重要詞彙 ( 列舉前

10 名 ),詳如表 2。其中詞頻係代表該詞於所有文章中

出現之次數,而權重值則為前述 KeyGraph 公式 (2) 所

計算的權重。

從統計表「關鍵字為基」模式中顯示「服務品質」

依據詞彙於文件中出現的次數,擷取頻次較高的詞

彙,亦即找出最適合代表該份文件的詞彙。該高頻詞

彙集合,以 Nhf 表示。

(3) 萃取連結 (Extracting Links):利用公式 (1) 計算詞彙

間於文章中相鄰之共現關係 (Co-occurrence),擷取高

共現頻率之詞彙進行連結,藉以獲得詞彙關聯度 ( 如

圖 2)。而經過該公式計算後,會分為數個詞彙群集

(Cluster Term),g 代表單一詞群、G 代表詞群集合 ( 詞

彙之間具有連接線的集合,以圖 2 為例,|G|=3,意指

3 個詞群 )。

公式 (1):

其中,wi:第 i 個關鍵字;wj:第 j 個關鍵字;S:句

子 (Sentence);D:文件 (Documents);wi, wj

∈ Nhf and wi, wj ⊂ S;而 |wi|,|wj| 是指 wi 與 wj

在句子 S 中出現的次數。

(4) 萃取重要詞彙 (Extracting Key Terms):利用公式 (2)

計算文件中其他詞彙與該高頻次詞彙群集之權重值,

以發掘頻次較低但較潛在重要之詞彙。其中 key(w) 為

文件中所有詞彙與高頻次詞群共同出現的關係,值愈

高代表愈是重要詞彙。

公式 (2):

限制式:

其中,w:其他詞彙;g:詞群內所有的關鍵詞;|g|s

( )∑∈

=Ds

sjswwwwassoc iji ,min),(

( ) ∑∈

−=Ds

sswgwgwbased ,

∏⊂

−−=

Gg gneighborsgwbasedwkey

)(),(11)(

∑∑∈∈

−=sw

ssDs

wgwgneighbors )(

∉∈−

=−gwifggwifwg

wg sss

,

圖 2 執行公式 (1) 之詞彙示意圖

( 王柳鋐等 , 2005)

圖 3 執行公式 (2) 之詞彙示意圖

( 王柳鋐等 , 2005)

Page 9: 植基於詞彙分析方法探索電子商務主題網絡之研究ijcs.topco-global.com/WebSite/Articles/2011Vol3_No3_137_154.pdf · 以作者共引分析(Author Co-citation Analysis)

2011 L.-C. Chen and Y.-P. Ku 145

排序關鍵字為基 斷詞-摘要為基 詞庫-摘要為基

詞彙 詞頻 權重 詞彙 詞頻 權重 詞彙 詞頻 權重

1 網際網路 226 0.025 網路 5803 0.171 網際網路 1383 0.253

2 顧客關係管理 117 0.012 企業 5427 0.204 交易市集 1133 0.193

3 線上購物 113 0.014 系統 4412 0.151 消費者 1028 0.178

4 服務品質 107 0.009 資訊 4049 0.158 使用者 882 0.200

5 延伸性標示語言 103 0.005 消費者 3544 0.115 網路服務技術 595 0.109

6 電子市場 88 0.009 資料 2867 0.084 資訊科技 502 0.087

7 供應鏈管理 84 0.008 交易市集 2825 0.120 電子化 419 0.080

8 商業模式 82 0.007 網際網路 2757 0.056 競爭力 394 0.075

9 信任 81 0.008 方式 2536 0.067 使用意願 374 0.051

10 行動商務 78 0.005 技術 2311 0.070 商業模式 356 0.070

表 2 電子商務文獻重要詞彙統計表 ( 不含「電子商務」乙詞 )

於樣本中共出現 107 次,但其權重值卻與「電子市場」

( 頻次為 88) 同為 0.009;另在「詞庫-摘要為基」中,

「使用者」出現次數為 882,排名第 4,但其權重排名

卻高居第 2。由此可證,KeyGraph 與傳統文件探勘技

術於詞彙採用上確實不同,其不僅保留高頻詞彙,亦保

留低頻且在結構上較重要的詞彙。

模式適切性分析

依據模式設計之概念,依序呈現實驗成果並加以

分析。圖中圓框大小及線條長短均不代表任何意義,黑

色圓框為高權重詞彙,粗框表示計算詞群共現後權重值

較高的顯著詞彙,而虛線框則代表低頻次之關鍵研究主

題。相關說明如後。

關鍵字為基模式

於匯入關鍵字之詞組資料後,顯示圖形詳如圖 4。

由圖中可知,顯著詞組有:「電子商務」、「網際網路」、

「電子市場」、「顧客關係管理」及「線上購物」,顯

示「網際網路」、「電子市場」與「線上購物」將為企

業導入「電子商務」之重要行銷及交易方式,而「顧客

關係管理」亦可提升企業獲利。「虛擬社群」為發展電

子商務時潛在的商業模式,透過「虛擬社群」的力量,

形成商務運作的有效手段 ( 以合購方式降低商品單價 )

而提升「顧客忠誠」將為達成顧客滿意及建構顧客關係

管理系統的重要目標,也是促進電子商務服務品質的潛

在要素;「資訊科技」是企業從事電子商務的重要基礎,

如「電子資料交換」係利用共通資料格式 (e.g. XML)

連結商家與消費者,「行動代理人」透過各式代理程式

進行自動化比價,以獲得更好的消費機會等,均為其潛

在之重要資訊技術。

關鍵字為基模式 ( 剔除「電子商務」干擾詞 )

經刪除「電子商務」干擾詞後的詞彙關聯圖如圖 5,

新增顯著詞有「服務品質」及「信任」,代表在線上購

物的知覺風險下,廠商或系統的「服務品質」及顧客的

「信任」將是影響其交易意願的重要因素;而電子商務

安全向來是學界及業界發展的重心,「公開金鑰」、「盲

簽章」、「認證」將是潛在的關鍵發展技術。此外,電

子商務係以跨企業、消費者等形式運作,故買賣雙方之

「協商」主題亦為可投入之研究內涵。

斷詞-摘要為基模式

經匯入由 CKIP 系統 ( 中研院資訊科學所 ) 斷詞處

理後之摘要詞組關聯圖如圖 6。由圖中可知,除「電子

商務」外,顯示之高權重詞有「企業」、「網路」、「資

訊」及「系統」,且上述詞彙間之關聯極為緊密,表示

「企業」於導入「電子商務」時,善加運用「網路」與「資

訊系統」即為電子商務研究之重心。而「基礎架構」將

Page 10: 植基於詞彙分析方法探索電子商務主題網絡之研究ijcs.topco-global.com/WebSite/Articles/2011Vol3_No3_137_154.pdf · 以作者共引分析(Author Co-citation Analysis)

146 SeptemberInternational Journal of Commerce and Strategy

為影響電子商務網路及系統效益之潛藏機會,亦即任何

改善商務網路系統之基礎建設,均為可行之研究機會。

此外,「組織」觀點的電子商務研究亦是學者認知之潛

在發展主題 ( 如文化或行為等因素 ),且於進行電子商

務活動時,必須以「客戶」為思考中心,著重於瞭解其

需求,並建構與其之關係,亦為其潛藏機會。

斷詞-摘要為基模式 ( 剔除「電子商務」干擾詞 )

經刪除「電子商務」干擾詞後的詞彙關聯圖如圖 7,

除原有之「企業」、「網路」、「資訊」及「系統」外,

新增「交易市集」乙詞,代表「企業」利用「網路系統」

從事電子商務時,建立「交易市集」將是重要的方向。

而潛在關聯部份,則新增「個案」乙詞,顯示出電子商

圖 4 關鍵字為基的 KeyGraph 分析 圖 5 關鍵字為基 ( 無 EC) 的 KeyGraph 分析

圖 6 斷詞-摘要為基的 KeyGraph 分析 圖 7 斷詞-摘要為基 ( 無 EC) 的 KeyGraph 分析

Page 11: 植基於詞彙分析方法探索電子商務主題網絡之研究ijcs.topco-global.com/WebSite/Articles/2011Vol3_No3_137_154.pdf · 以作者共引分析(Author Co-citation Analysis)

2011 L.-C. Chen and Y.-P. Ku 147

圖 9 詞庫-摘要為基 ( 無 EC) 的 KeyGraph 分析

不同分析模式 ( 摘要、關鍵字、摘要詞庫 ) 下的結果彙

整於表 3。不同詞彙分析模式各有其特點,整體而言,

電子商務之顯著及潛藏主題如下:

顯著主題

( 一 )「網際網路」為電子商務之運作基礎,而「企業」

及「使用者」( 或「消費者」) 則為電子商務交易

的主要對象。

( 二 ) 企業若以「線上購物」資訊系統之建置為基礎,

並提供各類交易模式 ( 如「交易市集」或「電子市

場」),將會有效提升商家及使用者之買賣意願。

( 三 ) 企業若能強化「顧客關係管理」,並重視「服務

品質」,將可提升消費者之回流率。

( 四 ) 綜合來說,任何使用「網路服務技術」來達成電

子商務交易之方法,均為現有研究的重要主題。

潛藏主題

( 一 ) 電子商務之資訊技術應用及基礎環境建置之面向:

1. 基礎建設:包括「系統架構」之整合、「電子商

務網站」之服務及「虛擬社群」之建構等主題,

均為潛在之研究內涵。特別是近年來社會網絡觀

點在資訊環境中的成長 ( 如 Facebook 的參與人數

暴增 ),造成社群發展範疇的擴大化及影響力的

深遠化,未來商務的主題可以結合部落格 (Blog)

及微型網誌 (Micro-blogging) 的發展來設計各項

應用之研究。

2. 商務安全:電子交易之相關安全主題,包括「公

務的發展,將因「公司」或「企業」的特性而有差異,

如以「個案」觀察進行分析將是潛在的有效研究方法。

詞庫-摘要為基模式

於摘要文章進行詞庫斷詞並匯入系統所產生之詞組

關聯圖如圖 8。圖形中說明企業透過「網際網路」進行

電子商務活動時,應以「使用者」及「消費者」為商務

運作核心主題,並以「交易市集」為運作重點。而「電

子交易」為促進「交易市集」成熟運作的關鍵手段,另

電子商務除了應完善其「電子商務網站」外,其相關之

「電子資料交換」、「系統架構」及「資料探勘」技術,

亦為推行「電子商務」成功之潛在關鍵因素。

詞庫-摘要為基模式 ( 剔除「電子商務」干擾詞 )

經刪除「電子商務」干擾詞後的詞彙關聯圖如圖 9。

顯著關係之關聯核心,由原「電子商務」轉換為「網

際網路」與「交易市集」,其新增詞彙則為「網路服

務技術」,顯示「網路服務技術」於「網際網路」之

運用逐漸受到重視;而潛藏關鍵則新增有「企業資源

規劃」及「全球化」並與多個顯著詞彙關聯密切,其

中「企業資源規劃」係可整合企業資訊系統,以實現

資源優化配置且為顧客關係管理及供應鏈管理運作順

暢的關鍵手段,而「全球化」是發展電子商務的關鍵

概念,故透過資訊科技及電子化的技術發展,將可達

成企業競爭力的提升。

模式分析結果彙總說明

依據前述分析,將顯著高頻詞彙及潛藏低頻詞彙在

圖 8 詞庫-摘要為基的 KeyGraph 分析

Page 12: 植基於詞彙分析方法探索電子商務主題網絡之研究ijcs.topco-global.com/WebSite/Articles/2011Vol3_No3_137_154.pdf · 以作者共引分析(Author Co-citation Analysis)

148 SeptemberInternational Journal of Commerce and Strategy

開金鑰」、「盲簽章」、「認證」等。

3. 智慧型技術:涵蓋「行動代理人」及「資料探勘」

等。

( 二 ) 電子商務之資訊流管理:

1. 以「企業資源規劃」優化內部資源管理,提供組織

進行顧客關係管理或供應鏈管理之各項運作基礎。

2. 以「電子資料交換」概念為核心,進行跨組織或產

業的商務訊息轉換。

( 三 ) 顧客觀點一向為電子商務之重要研究,由「顧客

關係管理」衍生到「顧客忠誠」之目標,故持續

性的交易行為即為潛在的研究主題。

( 四 )「全球化」是發展電子商務的重要現象,如何透過

資訊科技及網路化的發展,達成跨國、跨企業的

商務運作,以提升企業競爭力,將是電子商務研

究中極大的挑戰。

模式適切性評估

實驗中以文章「關鍵字」、「斷詞-摘要」及「詞

庫-摘要」三組模式進行詞彙關聯分析,結果分別呈現

不同視覺化之圖形,為驗證各模式對於電子商務學習之

適切性,本研究以問卷方式進行調查,問卷設計及分析

說明如下。

問卷設計

問卷中請填答者針對前述實驗所產生之 6 個圖形,

依其呈現電子商務研究主題之適切性進行填答,問項之

評分部分,共設計「非常適切」、「適切」、「普通」、

「不適切」及「非常不適切」等 5 個評分選項,並配 5

至 1 分;而排序部分則請填答者依適切性進行排序。

問卷對象

選擇本校資訊管理學系修畢「電子商務」之研究生

為發放對象,分採三次現場發放、集中作答之方式進行

問卷調查。

問卷結果分析

問卷調查中,共計發放 35 份問卷,其中 4 份問卷

填寫不全視為無效問卷,有效問卷達 88.57%,填答結

果彙整如表 4。由問卷結果得知,填答者普遍認為詞庫

與關鍵字較可明確表達研究主題;而干擾詞「電子商務」

刪除後,因主要詞彙 ( 電子商務 ) 消失,且詞彙關聯較

為複雜,故圖形中不易彰顯電子商務主題研究之重心;

最後經問項配分及統計後,其整體結果顯示「詞庫-摘

要為基 ( 含 EC)」模式為最可適切表達電子商務研究之

相關主題。

綜合說明

由問卷結果得知,本實驗產生之 6個圖形中,以「詞

庫-摘要為基 ( 含 EC)」模式最可適切表達電子商務研

究之相關主題。依據圖形中詞彙的特性及關聯網絡之呈

現方式,相關比較如表 5。

簡要說明如下:首先當以「關鍵字為基」時,其詞

彙雖具意義,但關聯較為分散;而「斷詞-摘要為基」

時,因詞彙萃取受限於斷詞器,故其詞彙較不易解讀;

表 3 KeyGraph 分析結果彙總

關鍵字

( 含 EC*)關鍵字

( 不含 EC)斷詞-摘要

( 含 EC)斷詞-摘要

( 不含 EC)詞庫-摘要

( 含 EC)詞庫-摘要

( 不含 EC)

(

顯著關係)

高頻詞彙

網際網路 網際網路 企業 企業 網際網路 網際網路

電子市場 電子市場 網路 網路 交易市集 交易市集

線上購物 線上購物 資訊 資訊 消費者 消費者

顧客關係管理 服務品質 系統 系統 使用者 使用者

電子商務 信任 電子商務 交易市集 電子商務 網路服務技術

(

潛藏機會)

低頻詞彙

電子資料交換 電子資料交換 組織 組織 電子資料交換 電子資料交換

行動代理人 行動代理人 基礎 基礎 資料探勘 資料探勘

虛擬社群 公開金鑰 構面 構面 系統架構 系統架構

資訊科技 盲簽章 客戶 客戶 電子交易 企業資源規劃

顧客忠誠 認證 廠商 個案 電子商務網站 全球化

* EC (Electronic Commerce):電子商務

Page 13: 植基於詞彙分析方法探索電子商務主題網絡之研究ijcs.topco-global.com/WebSite/Articles/2011Vol3_No3_137_154.pdf · 以作者共引分析(Author Co-citation Analysis)

2011 L.-C. Chen and Y.-P. Ku 149

最後,在「詞庫-摘要為基」模式中,則結合上述兩

種模式之優點,其詞彙不僅較具意義,圖形關聯亦較直

覺,因此,本研究認為「詞庫-摘要為基」模式較適用

於探索機會主題之研究。

電子商務主題趨勢分析

本研究於探討電子商務主題趨勢變化時,以電子商

務之三個發展時期為基礎,並採用最適切之「詞庫-摘

要為基 ( 含 EC)」模式進行,結果說明如後:

網路發展期 (1995~2000)

經將網路發展期文章匯入系統處理後產生之詞組關

聯圖如圖 10。

圖形顯著主題與「詞庫-摘要為基 ( 含 EC)」模式

結果相近。而潛在主題則說明:企業如善加運用「全球

資訊網」與並建構完善之「系統架構」,將可提昇電子

商務於網際網路之應用效益;「廣告」則為提昇消費者

參與電子商務之潛在資訊;而「企業資源規劃」將為企

業於推行電子商務時,重要之應用系統;最後,「供應

鏈管理」係為供應鏈與電子商務緊密結合之關鍵要素。

技術成長期 (2001~2005)

經將技術成長期文章匯入系統處理後產生之詞組關

聯圖如圖 11。圖形顯著主題與「詞庫-摘要為基 ( 含

EC)」模式結果相近。潛在主題為:「全球化」的交易

市集機制將是發展電子商務的營運利器;另學者可藉由

「個案研究」及「資料分析」,有效的觀察出企業於導

入電子商務過程中所遭遇的問題及解決方案,並可藉

以創造出更具特色的獲利機會及提高交易市集之運用效

益;此外「電子市場」係為連結電子商務及交易市集重

要之潛在要素。

應用擴充期 (2006~2009)

經將應用擴充期文章匯入系統處理後產生之詞組關

聯圖如圖 12。圖形顯著主題與「詞庫-摘要為基 ( 含

EC)」模式結果相近。潛在主題為:設計精良的「網路

表 4 問卷評分結果彙總

非常適切

(5 分 )適切

(4 分 )普通

(3 分 )不適切

(2 分 )非常不適切

(1 分 )分數

詞庫-摘要為基 ( 不含 EC) 10 人 3 人 14 人 3 人 1 人 111

詞庫-摘要為基 ( 含 EC) 8 人 15 人 8 人 0 人 0 人 124

關鍵字為基 ( 不含 EC) 3 人 12 人 11 人 5 人 0 人 106

關鍵字為基 ( 含 EC) 10 人 7 人 10 人 4 人 0 人 116

斷詞-摘要為基 ( 不含 EC) 1 人 5 人 8 人 8 人 9 人 74

斷詞-摘要為基 ( 含 EC) 2 人 1 人 13 人 10 人 5 人 78

表 5 分析模式適用性之比較

分析模式 說明

關鍵字為基

• 因學者選擇關鍵字時,會根據論文之題目與範圍,使用最精簡的詞彙來描述,故關鍵字可代表該篇

文章之重點;本研究經詞彙處理後,共取得 5,380 個關鍵詞彙。

• 每一篇論文中之關鍵字數量通常具有一定之限制,故詞彙之共現比例較低。

• 機會探索之圖形詞彙雖具意義,但關聯性較為分散。

斷詞-摘要為基

• 以中研院 CKIP 系統將論文摘要予以斷詞,經由同義詞之處理後,共計取得 8,085 個名詞詞彙。

• 擷取之重要詞彙多為普通名詞,實驗中之短詞詞頻遠高於詞頻門檻值,故較無法萃得具意義之長詞,

因此進行分析時之詞彙長度較短 ( 如網路、行為、成員及企業等 )。

• 其圖形顯示結果之詞彙數量雖多,關聯層數較深,但詞彙之意涵過於廣泛。

詞庫-摘要為基

• 論文摘要在經過專業詞庫進行斷詞後,共取得 4,018 個詞彙。

• 摘要因需描述研究主題及結果,且具有完整語意,於詞彙共現之角度而言,較優於關鍵字之表現。

• 機會探索之圖形詞彙較具實質意義,關聯亦較為直覺、收斂。

Page 14: 植基於詞彙分析方法探索電子商務主題網絡之研究ijcs.topco-global.com/WebSite/Articles/2011Vol3_No3_137_154.pdf · 以作者共引分析(Author Co-citation Analysis)

150 SeptemberInternational Journal of Commerce and Strategy

圖 10 網路發展期 (1995~2000) 的 KeyGraph 分析

商店」將成為吸引消費者線上購物的意願,亦可提昇企

業於電子商務之競爭優勢;「顧客關係管理」系統將可

提供消費者較佳之服務品質,並可提昇「顧客滿意」度。

主題趨勢分析彙總

依據前述各時期實驗結果,將顯著高頻詞彙及潛藏

低頻詞彙在不同時期 ( 摘要、關鍵字、摘要詞庫 ) 下的

詞彙結果綜整於表 6。

顯著主題之趨勢

研究主題的轉變

由實驗結果得知,顯著主題於各時期均無明顯變

化,表示「網際網路」、「交易市集」、「消費者」、「使

用者」及「服務品質」均為「電子商務」中不可或缺之

重要因素,其主題上僅於應用擴充期新增「服務品質」

一詞,表示隨著學者於研究電子商務時,已將「使用者」

逐漸移轉至「服務品質」主題。

主題關聯的轉變

由各時期所產生之關聯圖得知,主題關聯性隨著

時間的轉變而有增強之趨勢,如在網路發展期「消費

者」與「電子商務」主題間常探討到「線上購物」;

而在技術成長期,兩者除探討「線上購物」外,尚加

入「使用意願」相關主題;最後在應用擴充期更加入「滿

意度」主題。

潛藏主題之趨勢

網路應用轉變

隨著網路頻寬及資訊技術的提昇,使「全球資訊

網」的各式運用,轉變為「電子市場」的商務運作,

而近期跨越地域性的「網路商店」,已為企業製造出

龐大商機。

企業經營理念轉變

網路發展初期,企業多運用「企業資源規劃」以優

化內部資源。而在「全球化」浪潮的推動之下,促使企

業需應用電子商務來進行深度 E 化,以提升全球化供應

鏈的運籌管理能力,而如何運用「企業間電子商務」達

到降低成本、提昇創新能力等目標,將會是企業能否在

全球化競爭下脫穎而出的關鍵。

學者研究主題轉變

網路發展初期,因網路品質及資訊科技均未臻成

圖 11 技術成長期 (2001~2005) 的 KeyGraph 分析

圖 12 應用擴充期 (2006~2009) 的 KeyGraph 分析

Page 15: 植基於詞彙分析方法探索電子商務主題網絡之研究ijcs.topco-global.com/WebSite/Articles/2011Vol3_No3_137_154.pdf · 以作者共引分析(Author Co-citation Analysis)

2011 L.-C. Chen and Y.-P. Ku 151

熟,學者研究重心多置放於電子商務之「系統架構」及

「企業資源規劃」等主題,以求發展出更成熟之商務系

統;而隨著網路泡沫的迅速消退,及網路科技的發達,

經營電子商務之獲利要素受到企業界及學界的重視,故

「資料分析」及「個案研究」成為探討電子商務成功要

素之有效的研究方法;近年因 Web 2.0 的成熟,使用者

對網路購物的要求提昇,企業的經營重心亦逐漸移轉至

顧客,故如何應用「顧客關係管理」以提昇「顧客滿意

度」之主題直至應用擴充期才受到重視。

小結

網路發展期

在網路泡沫前,隨著網際網路線上交易模式的興

起,企業較著重於線上交易平台、系統架構及全球資訊

網等資訊技術的發展,以吸引網路使用者進行線上消費。

技術成長期

隨著網路泡沫的快速衰退,全球化的概念逐漸受到

重視,企業開始投入電子商務各類交易模式的分析與研

究,學界亦將研究重心移轉至消費者對電子商務的使用

意願及關鍵成功因素的探討。

應用擴充期

因應 Web 2.0 的興起,使用者及企業間均開始講究

互動的商業模式,要求較高的服務品質,所以滿意度與

忠誠度遂成為發展電子商務的重點,而學界亦開始研究

企業如何提昇競爭力及顧客滿意度之相關主題。

近年來隨著 Web2.0 的盛行,網路應用及使用者均

不斷擴增,使電子商務潛藏著無限商機,然而企業對於

電子商務的運用仍存在許多問題。透過本實驗結果,建

議企業於導入電子商務時,首應考量各種經營模式 ( 如

商務網站及交易市集等 ),並迅速提供各項資訊給消費

者,以利與消費者建立良好的互動關係。營造消費者可

於家中購物的網路商店,進而提昇消費者對商品的滿意

度及忠誠度。

結論與建議

本研究先將論文關鍵字進行同義及相似度分析,以

建構電子商務專業詞庫,再將論文區分為「關鍵字」、

「斷詞-摘要」及「詞庫-摘要」三組模式進行詞彙關

聯分析,藉以探索電子商務關鍵及潛藏之研究主題,並

可觀察電子商務於各時期之主題變化,提供除內容分析

與主觀歸納外另一種不同的有效作法。

經解析 KeyGraph 演算程式所繪製之知識結構關聯

圖,可獲致以下的結論:

( 一 ) 就整體關鍵主題及潛藏主題方面,透由實驗所產生

之關聯圖顯示,國內電子商務研究主題多集中在探

討各種交易模式 ( 如交易市集、電子市場及線上購

物 ),及強調其服務品質 ( 如顧客關係管理、信任 )

等相關主題,而潛藏之研究主題則為集中在資源整

合 ( 企業資源規劃、電子資料交換 ) 及各類資訊科

技之運用 ( 如行動代理人、公開金鑰、認證簽章及

資料探勘 ) 等資訊應用主題,除可提供後續對電子

商務有興趣者參考運用外,企業於導入電子商務

時,亦可參考使用。

( 二 ) 就分析模式適用性及專業詞庫於文件中運用效益方

表 6 KeyGraph 主題趨勢分析彙總表

網路發展期 技術成長期 應用擴充期

高頻詞彙 ( 顯著關係 )

電子商務 電子商務 電子商務

網際網路 網際網路 網際網路

交易市集 交易市集 交易市集

消費者 消費者 消費者

使用者 使用者 服務品質

低頻詞彙 ( 潛藏機會 )

供應鏈管理 供應鏈管理 供應鏈管理

全球資訊網 全球化 網路商店

系統架構 資料分析 顧客滿意

廣告 個案研究 顧客關係管理

企業資源規劃 電子市場 企業間電子商務

Page 16: 植基於詞彙分析方法探索電子商務主題網絡之研究ijcs.topco-global.com/WebSite/Articles/2011Vol3_No3_137_154.pdf · 以作者共引分析(Author Co-citation Analysis)

152 SeptemberInternational Journal of Commerce and Strategy

面,經驗證後之三組模式中以「詞庫-摘要」之圖

形詞彙較具實質意義,顯示專業詞庫確可改善斷詞

系統之短詞問題,且可萃取出較符合研究主題之詞

彙,其詞彙之關聯亦較為直覺、收斂,與其他二組

模式相比,較能適切表達整體研究主題。故本研究

認為「以關鍵字為基進行專業詞庫之建構」及「使

用專業詞庫至摘要中擷取特徵詞彙」的整合方法,

是文字探勘詞彙擷取中較為有效的手段。另本研究

所建構之專業詞庫,亦可供後續學者於動態分析電

子商務主題時參考運用。

本研究雖獲得上述成果,但仍有以下兩點限制:

( 一 ) 實驗樣本僅以國內博碩士論文為研究對象,其中不

包含學術期刊、研討會及企業界之相關文獻。因此,

就蒐整之文章而言,可能無法涵蓋所有電子商務之

研究領域。

( 二 ) 實驗中以論文關鍵字所建立之專業詞庫,並未考量

論文作者在用詞上可能產生認知的疑義,未來可從

詞彙語意之觀點進行後續深度分析。

建議未來學者可朝下列方向從事後續研究:

( 一 ) 整合國內外相關研究文獻,進行台灣與國際學術電

子商務研究焦點之比較分析。

( 二 ) 蒐整國內產、官、學界之電子商務相關文獻或報告

( 如經濟部商業司出版之電子商務年鑑 ),以探討學

術與實務對於電子商務投入重心之差異。3. 可從詞

彙語意之觀點取代本研究之詞彙擷取模式,以進行

後續深度分析。

誌謝

本研究承蒙行政院國家科學委員會專案經費支持

( 計畫編號:NSC 98-2410-H-606-006-MY2),謹致

謝忱。

參考文獻

中研院資訊科學所,CKIP 系統,取自:http://rocling.iis.sinica.edu.tw/CKIP/wordsegment.htm

方文昌、汪志堅、蘇永盛,2003。電子商務的研究主題

分類:以台灣地區的研究論文所進行之內容分析,

電子商務研究,第一卷第一期,3-24。

王柳鋐、曾國泰、林奇緯,2005。Chance Discovery在關鍵詞萃取之研究,第三屆演化式計算應用研

討會暨 2005 機會探索國際工作坊。

王鼎元,2007。調適性演化基因體遺傳演算法之設計與

評估,輔仁大學資訊管理學系碩士論文。

吳欣達,2006。利用文件探勘技術找尋疾病關連基因,

國立陽明大學生物資訊研究所碩士論文。

余國訓、李元墩、李元德,2011。電子商務研究智慧結

構之演變-作者共引文分析的應用,商略學報,第

三卷第一期,1-24。

李昱成,2009。利用 KeyGraph 發掘中國軟實力學域

發展趨勢,國防大學管理學院資訊管理學系碩士論

文。

林木花,2005。擴展社會關聯網路在機會發掘之研究-

以手機設計為例,真理大學管理科學研究所碩士論

文。

林木花、楊筱芳、林我聰,2008。KeyGrpah 在建構論

文議題地圖之研究 - 以 TANET 之中小學網路教學

與數位學習論文為例,第 10 屆全國資訊管理博士

生學術交流研討會。

林頌堅,2010。以詞語共現網絡分析探勘資訊傳播學領

域的研究主題與關係,圖書資訊學研究,第四期第

二卷,123-148。

袁立安,2007。混合式自動文件摘要方法,中山大學資

訊管理學系研究所碩士論文。

崔維翰,2007。應用 KeyGraph 探索 web2.0 產品之隱

藏商機- Blog 網站個案研究,真理大學管理科學

研究所碩士論文。

郭英峰、游景文,2008。我國博碩士論文在行動商務上

之研究現況與發展趨勢,電子商務學報,第十卷第

三期,573-594。

陳年興、謝盛文、黃婉婷,2007。自動化建構具時間向

度之知識結構映射圖-以資訊管理領域之知識及其

演進為例,資訊管理學報,第十四卷第一期,1-32。

陳禹辰、皮世明、范錚強,1996。我國資訊管理研究方

向及方法-碩士論文分析,資訊管理研究,第一卷

第一期,1-18。

陳素丹,2007。運用機會探索發掘 85 度 C 咖啡連鎖店

快速成長之劇本,真理大學管理科學研究所碩士論

文。

陳道輝,2003。利用學位論文資訊萃取資訊領域相關

研究主題關聯性,中山大學資訊管理研究所碩士論

文。

黃旭男、洪廣朋、郭嘉欣,2003。我國電子商務之研究

現況與趨勢-博碩士論文分析,管理與系統,第十

卷第二期,149-182。

黃國政,2006。運用文字探勘技術於人才招募推薦系統

之研究,靜宜大學資訊管理學系研究所碩士論文。

經濟部商業司、財團法人資訊工業策進會,2007。2007 中華民國電子商務年鑑 ( 第壹篇政策篇 ),台北 : 經濟部商業司。

Page 17: 植基於詞彙分析方法探索電子商務主題網絡之研究ijcs.topco-global.com/WebSite/Articles/2011Vol3_No3_137_154.pdf · 以作者共引分析(Author Co-citation Analysis)

2011 L.-C. Chen and Y.-P. Ku 153

楊筱芳、林木花、林我聰,2008。結合 KeyGraph 與紮

根理論之開放式編碼分析 MIS Quarterly 的研究議

題,2008 數位內容學術研討會。

廖述賢,2007。電子商務科技與應用- 1995 至 2005年十年回顧,電子商務學報,第九卷第二期,399-434。

鄭百勝,2006。應用關聯規則建構具方向性之領域知識

結構圖-以資訊管理領域為例,國立中山大學資訊

管理研究所碩士論文。

謝盛文、陳道輝、陳年興,2003。利用知識關聯圖達到

外顯知識分享之研究,全國計算機會議,中華民國

資訊學會主辦,台中逢甲大學。

Chen, H., 2001. Knowledge Management Systems: A Text Mining Perspective , Tucson: Knowledge Computing Corporation.

Delen, D. and Crossland, M. D., 2008. Seeding the Survey and Analysis of Research Literature with Text Mining, Expert Systems with Applications , 34(3), 1707-1720.

DiNucci, D., 1999. Fragmented Future, Print, 53(4), 221-222.

Goda, S. and Ohsawa, Y., 2007. Estimation of Chain Reac t ion Bankrup tcy S t ruc tu re by Chance Discovery Method - with Time Order Method and Directed KeyGraph, Journal of Systems Science and Systems Engineering, 16(4), 489-498.

Hong, C. F., 2009. Qualitative Chance Discovery - Extracting Competitive Advantages, Information Sciences, 179(11), 1570-1583.

IDC - Press Release, 2008. Regional IDC Survey Shows 50% of Asian Enterprises View Web 2.0 as a Business Opportunity, available http://www.idc.com/AP/pressrelease.jsp?containerId=prSG21042808

Kauffman, R. J. and Walden, E. A., 2001. Economics and Electronic Commerce: Survey and Directions for Research, International Journal of Electronic Commerce, 5(4), 5-116.

Kim, H. and Lee, J. Y., 2008. Exploring the Emerging Intellectual Structure of Archival Studies Using Text Mining: 2001-2004, Journal of Information Science, 34(3), 356-369.

Lee, S. M., Hwang, T. and Kim, J., 2007. An Analysis of Diversity in Electronic Commerce Research, International Journal of Electronic Commerce , 12(1), 31-67.

Li , Y. R. , Wang, L . H. and Hong, C. F. , 2009. Extracting the Significant-rare Keywords for Patent Analysis, Expert Systems with Applications 36(3-1), 5200–5204.

Llorà, X., Matsumura, N., Goldberg, D. E., Ohsawa, Y., Ohnishi, K. and Gonzales, A., 2004. Discovering Chance Scenarios Using Small-world KeyGraphs and Evolutinary Computation, First European Workshop on Chance Discovery (EWCD-2004) , 51–62.

Ngai, E. W. T. and Wat, F. K. T., 2002. A Literature Review and Classification of Electronic Commerce Research, Information & Management, 39(5), 415-429.

Ohsawa, Y., Benson, N. E. and Yachida, M., 1998. KeyGraph: Automatic Indexing by Co-occurrence Graph Based on Building Construction Metaphor, Proceedings of Advanced Digital Library Conference (IEEE ADL'98), 12–18.

Ohsawa, Y. and McBurney, P. (Eds), 2003. Chance Discovery. Advanced Information Processing Series, Berlin: Springer.

Ong, T. H., Chen, H., Sung, W. K. and Zhu, B., 2005. Newsmap: A Knowledge Map for Online News, Decision Support Systems, 39(4), 583-597.

O'Reilly, T. and Battelle, J., 2004. Opening Welcome: State

of the Internet Industry, San Francisco, California,

October 5.

Prendinger, H. and Ishizuka, M., 2001. Let's Talk! S o c i a l l y I n t e l l i g e n t A g e n t s f o r L a n g u a g e Conversation Training, IEEE Transactions on Systems, Man and Cybernetics, 31(5), 465-471.

Seo, Y., Iwase, Y. and Takama, Y., 2006. KeyGraph-based BBS for Online Chance Discovery, IEEE International Conference on Systems, Man and Cybernetics (ICSMC), 1754-1758.

Turban, E., Lee, J., King, D. and Chung, M., 2006. Electronic Commerce - a Managerial Perspective, USA: Pearson Prentice Hall.

Wareham, J., Zheng, J. G. and Straub, D., 2005. Critical Themes in Electronic Commerce Research: A Meta-analysis, Journal of Information Technology, 20(1), 1-19.

Zwass, V., 1996. Electronic Commerce: Structures and Issues, International Journal of Electronic Commerce, 1(1), 3-23.

Z w a s s , V. , 2 0 0 3 . E l e c t r o n i c C o m m e r c e a n d O r g a n i z a t i o n a l I n n o v a t i o n : A s p e c t s a n d Opportunities, International Journal of Electronic Commerce, 7(3), 7-37.

Page 18: 植基於詞彙分析方法探索電子商務主題網絡之研究ijcs.topco-global.com/WebSite/Articles/2011Vol3_No3_137_154.pdf · 以作者共引分析(Author Co-citation Analysis)

154 SeptemberInternational Journal of Commerce and Strategy

陳良駒為國防大學管理學院資訊管理學系副教授,中華民國交通大學資訊管理博士。主要研究領域為知識管理、資

訊萃取、資料探勘、電子商務及資訊安全。學術論文曾發表於資訊管理學報 (TSSCI)、中國大陸研究 (TSSCI)、資訊

管理展望、國防管理學報、The Electronic Library (SSCI)、Journal of Information Science (SSCI)、Expert Systems with Applications (SCI)、Journal of The OR Society (SSCI)、The Korean Journal of Defense Analysis (SSCI)、Scientometrics (SSCI) 等期刊。

Liang-Chu Chen is an Associate Professor in the Department of Information Management, Management College, National Defense University. He received his Doctoral degree from the Institute of Information Management, National Chiao-Tung University. His main research areas include Knowledge Management, Information Extraction, Data Mining, Electronic Commerce and Information Security. His research papers have been published at Journal of Information Management (TSSCI), Mainland China Studies (TSSCI), Journal of Information Management-Concepts, Systems and Applications, Journal of Defense Management, The Electronic Library (SSCI), Journal of Information Science (SSCI), Expert Systems with Applications (SCI), Journal of The OR Society (SSCI), The Korean Journal of Defense Analysis (SSCI), Scientometrics (SSCI) and others..

顧亦平目前服務於國家政府機構,畢業於國防大學管理學院資訊管理學系碩士班。主要研究領域為電子商務與文字

探勘。

Yi-Ping Ku is an Officer in Taiwan's government. He received his Master degree from the Department of Information Management, Management College, National Defense University. His main research areas include Electronic Commerce and Text Mining.