人工智慧與相關領域專有名詞解釋
人工智慧 (AI) 相關
人工智慧 (AI)
解釋: 人工智慧是研究和開發能夠模擬人類智能行為的計算機系統。 範例: 智能語音助手如Siri、自動駕駛汽車、圍棋AI如AlphaGo。 比喻: 就像是教一台電腦思考和做決定,類似於教一個孩子,但用數學和邏輯而不是經驗和情感。
弱人工智慧 (Narrow or Weak AI)
解釋: 專注於執行特定任務的AI,沒有真正的自我意識。 範例: 掃地機器人、天氣預測系統、推薦算法。 比喻: 像一個只會做一道菜的廚師,非常擅長煎牛排,但不會做其他任何料理。
強(通用)人工智慧 (General or Strong AI)
解釋: 具有與人類相當的認知能力,能夠理解、學習和應用知識到各種不同任務的AI。 範例: 目前還沒有真正的強AI實例,但科幻作品中如《2001太空漫遊》中的HAL 9000。 比喻: 像是一個全能的學生,能夠學習任何科目並靈活應用所學知識解決不同問題。
超人工智慧 (Super AI)
解釋: 超越人類智能的AI,能夠比人類更快、更準確地處理各種任務。 範例: 目前仍是理論概念,尚未實現。 比喻: 如同具有超能力的大腦,不僅能解決人類能解決的所有問題,還能解決人類無法理解的複雜問題。
圖靈測試 (Turing Test)
解釋: 一種測試機器是否具有與人類相當智能的方法,由Alan Turing提出。 範例: 若評判無法分辨與其交談的是人還是機器,則該機器通過測試。 比喻: 就像是一場文字版的"假面舞會",如果戴著面具的AI能讓人類認為它是另一個人,就算通過測試。
智能客服 (Chatbot)
解釋: 模擬人類對話的程式,可以回答問題或執行簡單任務。 範例: 網站客服機器人、虛擬助手如ChatGPT。 比喻: 像是數位世界的接待員,24小時待命回答訪客的各種問題。
理性行動 (Acting Rationally)
解釋: AI系統根據現有信息做出最合理、最有效的決策。 範例: 在圍棋中選擇最有可能獲勝的下一步。 比喻: 像一個總是選擇最短路徑的導航系統,不受情緒或偏見影響。
智慧代理 (Intelligent Agents)
解釋: 能夠感知環境並採取行動以達成目標的AI實體。 範例: 網絡爬蟲、自動交易系統、虛擬遊戲角色。 比喻: 就像訓練有素的管家,能夠觀察主人的喜好並主動完成各種任務。
符號主義 AI (Symbolic AI)
解釋: 通過操作符號和規則來模擬人類思維的AI方法。 範例: 早期的專家系統、邏輯推理系統。 比喻: 像是遵循烹飪食譜的廚師,一步步按照明確的指示操作。
專家系統 (Expert System)
解釋: 模擬人類專家決策能力的知識系統。 範例: 醫療診斷系統、稅務諮詢系統。 比喻: 類似於將資深專家的經驗和知識裝入計算機中,讓它能夠提供專業建議。
模糊邏輯 (Fuzzy Logic)
解釋: 處理模糊、不精確或部分真實信息的數學方法。 範例: 自動洗衣機根據衣物髒污程度調整洗滌時間。 比喻: 就像人類判斷天氣的方式,不是非黑即白的"冷"或"熱",而是"有點冷"、"很熱"等連續變化的概念。
多代理系統 (Multi-Agent Systems, MAS)
解釋: 多個智能代理相互作用、協作或競爭以解決問題的系統。 範例: 交通控制系統、網絡安全防禦系統。 比喻: 就像一支足球隊,每個球員(代理)有自己的任務,但通過協作達成共同目標。
認知計算 (Cognitive Computing)
解釋: 模擬人類思維過程的計算技術,整合各種AI技術。 範例: IBM Watson、健康諮詢系統。 比喻: 像是一個學習人類思考方式的電腦大腦,不只是處理數據,還能理解並推理。
機器智慧 (Machine Intelligence)
解釋: 機器展現的智能行為,特別是學習和適應能力。 範例: 能自我改進的棋類程式、自適應推薦系統。 比喻: 如同一個不斷從經驗中學習的學生,每次嘗試都變得更聰明。
自主系統 (Autonomous Systems)
解釋: 能夠在沒有人類干預的情況下獨立運作的系統。 範例: 自動駕駛車輛、無人機、工廠自動化機器人。 比喻: 像是有自我意識的機器,能夠自行判斷情況並做出決策,類似於不需要指揮的管弦樂隊。
計算智能 (Computational Intelligence)
解釋: 通過啟發式方法解決複雜問題的技術,如進化算法、模糊系統。 範例: 優化路線規劃、金融市場預測。 比喻: 就像大自然進化過程的數位版本,通過不斷嘗試和選擇找出最佳解決方案。
知識表示 (Knowledge Representation)
解釋: 以計算機可處理的形式存儲和組織知識的方法。 範例: 本體論、語義網絡、知識圖譜。 比喻: 相當於為計算機創建一本百科全書,但是以特定結構組織,使機器能夠理解和使用這些知識。
約束滿足問題 (Constraint Satisfaction Problems)
解釋: 在一組限制條件下尋找滿足所有約束的解決方案。 範例: 排課系統、資源分配、數獨遊戲。 比喻: 像是安排一次家庭聚會,需要考慮每個人的時間限制、飲食偏好和座位安排等多種約束。
框架理論 (Frame Theory)
解釋: 一種知識表示方法,將相關信息組織成框架結構。 範例: 描述"餐廳"的框架包含位置、菜單、服務員等屬性。 比喻: 就像填寫一份表格,每個欄位都有特定的信息需要填寫,共同描述一個完整概念。
神經符號系統 (Neuro-Symbolic Systems)
解釋: 結合神經網絡的學習能力和符號推理的明確性的混合系統。 範例: 能進行視覺理解並回答相關問題的AI系統。 比喻: 如同左右腦協作,左腦(符號系統)負責邏輯推理,右腦(神經網絡)處理模式識別和創造性思維。
機器學習 (ML) 相關
機器學習 (Machine Learning, ML)
解釋: 使計算機能夠從數據中學習並改進的科學,無需明確編程。 範例: 垃圾郵件過濾器、語音識別、推薦系統。 比喻: 就像教一個孩子認識水果,不是告訴他具體規則,而是給他看許多水果的例子,讓他自己歸納特徵。
監督式學習 (Supervised Learning)
解釋: 從已標記的訓練數據中學習的機器學習方法。 範例: 預測房價、分類電子郵件為垃圾或非垃圾。 比喻: 如同有老師指導的學習,每次練習都會得到正確答案的反饋。
分類 (Classification)
解釋: 將輸入數據分配到預定義類別的任務。 範例: 判斷一封郵件是垃圾郵件還是正常郵件、識別圖像中的物體。 比喻: 像郵局分類信件,根據目的地將信件放入不同的郵袋。
迴歸 (Regression)
解釋: 預測連續數值輸出的任務。 範例: 房價預測、溫度預測、股票價格趨勢。 比喻: 就像估計一個人的體重,而不是簡單分類為"輕"或"重"。
標記 (Label)
解釋: 訓練數據中的目標值或分類結果。 範例: 電子郵件標記為"垃圾"或"非垃圾",圖片標記為"貓"或"狗"。 比喻: 如同物品的價格標籤,告訴你這個物品的實際價值或類別。
標註資料 (Labeled Data)
解釋: 包含輸入特徵及其對應正確輸出的訓練數據。 範例: 帶有患者症狀和醫生診斷結果的醫療記錄。 比喻: 就像有答案的練習題,提供問題和正確解答供學習參考。
非監督式學習 (Unsupervised Learning)
解釋: 從未標記數據中尋找模式和結構的學習方法。 範例: 客戶群體分析、異常檢測。 比喻: 像考古學家發掘古代文物,沒有說明書,需要通過觀察特徵和模式來理解它們的用途和關聯。
分群 (Clustering)
解釋: 將相似的數據點分組到同一群組的技術。 範例: 市場細分、文檔分類、客戶行為分析。 比喻: 就像整理衣櫃,把類似的衣服放在一起,例如將所有T恤分到一組,所有褲子分到另一組。
降維 (Dimensionality Reduction)
解釋: 減少數據特徵數量同時保留關鍵信息的技術。 範例: 主成分分析(PCA)、t-SNE可視化。 比喻: 像是製作地圖,將三維的地球表面簡化為二維平面,雖有失真但保留了主要信息。
關聯規則學習 (Association Rule Learning)
解釋: 發現數據項之間關聯或相關性的方法。 範例: 超市購物籃分析、商品推薦。 比喻: 就像一位經驗豐富的店員,能夠觀察到"購買尿布的顧客往往也會購買啤酒"這類購物模式。
沒有標籤的輸入資料 (Unlabeled Data)
解釋: 僅包含特徵但沒有對應標籤的數據。 範例: 網絡上的圖片集、用戶行為日誌。 比喻: 像是一堆沒有分類的照片,你可以看到內容但沒有告訴你這些照片應該如何歸類。
半監督學習 (Semi-supervised Learning)
解釋: 結合少量標記數據和大量未標記數據的學習方法。 範例: 網頁分類、語音識別。 比喻: 如同有一位老師偶爾提供指導,大部分時間學生需要自學,但有少量的範例可供參考。
強化學習 (Reinforcement Learning, RL)
解釋: 通過與環境互動和獎懲機制學習的方法。 範例: 機器人控制、遊戲AI如AlphaGo。 比喻: 類似訓練寵物,做對了就給獎勵(零食),做錯了就不獎勵,慢慢引導出正確行為。
代理人 (Agent)
解釋: 在強化學習中,能夠觀察環境、作出決策並執行行動的實體。 範例: 遊戲中的AI角色、自動駕駛系統。 比喻: 像是一名實習生,通過嘗試和錯誤學習如何執行任務,從反饋中不斷改進。
環境 (Environment)
解釋: 代理人所處的外部系統,提供狀態信息並對代理人的行動作出反應。 範例: 遊戲世界、模擬器、物理世界。 比喻: 就像一個遊樂場,提供各種設施(狀態)和規則,對使用者的行為有所回應。
狀態 (State)
解釋: 環境在特定時間點的完整描述或配置。 範例: 棋盤上棋子的位置、機器人各關節的角度。 比喻: 類似於拍攝環境的快照,記錄下當前所有相關信息。
行動 (Action)
解釋: 代理人可以執行的操作,改變環境狀態。 範例: 機器人向前移動、AI玩家下棋。 比喻: 就像按下遙控器上的按鈕,每個按鈕對應不同的操作,影響電視的狀態。
獎勵 (Reward)
解釋: 環境返回給代理人的數值信號,指示行動的好壞。 範例: 遊戲中的得分、完成任務獲得的點數。 比喻: 如同成績單上的分數,高分表示表現好,低分表示需要改進。
策略 (Policy)
解釋: 代理人在給定狀態下選擇行動的方法或規則。 範例: 在圍棋中選擇最優落子位置的策略。 比喻: 類似於生活中的決策原則,如"遇到紅燈就停,遇到綠燈就行"。
遷移學習 (Transfer Learning)
解釋: 將一個任務學到的知識應用到相關但不同的任務上。 範例: 用識別貓狗的模型幫助識別獅子和老虎。 比喻: 就像學會騎自行車後更容易學會騎摩托車,因為基本平衡和操控技能可以遷移。
元學習 (Meta-Learning)
解釋: "學習如何學習"的方法,能夠快速適應新任務。 範例: 少樣本學習系統,能從幾個例子中快速學習。 比喻: 如同學會了學習方法的學生,面對新科目能夠迅速掌握核心知識,而不需要從頭學起。
自監督學習 (Self-Supervised Learning)
解釋: 從數據本身自動生成監督信號的學習方法。 範例: 預測文本中被遮蓋的詞、預測圖像缺失部分。 比喻: 像是自學成才的學生,通過閱讀書籍先遮住某些內容,然後根據上下文猜測遮住的部分,再進行自我檢驗。
集成學習 (Ensemble Learning)
解釋: 組合多個模型以獲得更好預測性能的技術。 範例: 隨機森林、投票分類器、梯度提升。 比喻: 就像請多位醫生會診,綜合各自專業意見做出更準確的診斷,避免單一醫生的錯誤判斷。
隨機森林 (Random Forest)
解釋: 由多個決策樹組成的集成學習方法,通過投票或平均得出結果。 範例: 預測客戶流失、疾病診斷。 比喻: 就像一個由多位專家組成的委員會,每位專家(決策樹)基於稍微不同的經驗做出判斷,最終取多數意見。
梯度提升樹 (Gradient Boosting, e.g., XGBoost)
解釋: 順序建立弱學習器,每個新學習器修正前一個的錯誤的集成方法。 範例: 房價預測、點擊率預測。 比喻: 像團隊接力賽,每個隊員(弱學習器)都試圖彌補前一個隊員的不足,最終團隊整體表現優於任何個人。
貝葉斯網路 (Bayesian Networks)
解釋: 通過有向無環圖表示變量間概率關係的模型。 範例: 醫療診斷系統、風險評估。 比喻: 如同追蹤線索的偵探,根據已知信息和各種可能性之間的關聯推斷未知事實的可能性。
支持向量機 (Support Vector Machine, SVM)
解釋: 尋找能將不同類別數據分隔開的最佳邊界的分類算法。 範例: 文本分類、圖像識別。 比喻: 就像在混合人群中劃一條最公平的界限,使得兩組人分得越開越好,並保留一定的安全距離。
K-近鄰算法 (K-Nearest Neighbors, KNN)
解釋: 基於最接近的訓練樣本進行分類或迴歸的技術。 範例: 推薦系統、圖像分類。 比喻: 類似於"告訴我你的朋友是誰,我就能告訴你你是什麼樣的人",通過觀察最相似的已知樣本來判斷未知樣本的特性。
多任務學習 (Multi-task Learning)
解釋: 同時學習多個相關任務以提高每個任務性能的方法。 範例: 同時預測用戶的年齡、性別和興趣。 比喻: 像是一個同時學習多門相關課程的學生,學習物理可以幫助理解數學,反之亦然。
主動學習 (Active Learning)
解釋: 算法主動選擇最有價值的訓練數據進行標注的學習方法。 範例: 文檔分類、圖像識別中的數據選取。 比喻: 像一個好學生,不是被動接受所有教材,而是主動問老師最困惑的問題以最高效地學習。
增量學習 (Incremental Learning)
解釋: 能夠從新數據持續學習而不忘記之前學到知識的方法。 範例: 在線推薦系統、不斷更新的垃圾郵件過濾器。 比喻: 就像不斷擴展知識的學生,在保留已學知識的同時,能夠融入新的學習內容。
零樣本學習 (Zero-shot Learning)
解釋: 能夠識別訓練中未見過的類別的學習方法。 範例: 能夠識別未訓練過的動物種類的系統。 比喻: 如同從未見過斑馬但通過"像馬但有黑白條紋"的描述就能識別出斑馬的能力。
蒸餾學習 (Knowledge Distillation)
解釋: 將大型複雜模型的知識轉移到小型簡單模型的技術。 範例: 將大型語言模型知識壓縮到移動設備可運行的小模型。 比喻: 像是一位資深教授將多年專業知識濃縮成簡潔教材,使學生能更容易理解複雜概念。
課程學習 (Curriculum Learning)
解釋: 按難度遞增順序組織訓練數據的學習策略。 範例: 語言學習系統從簡單詞彙到複雜語法漸進學習。 比喻: 就像學校教育,先教簡單的加減法,然後是乘除法,最後才是微積分,循序漸進。
高斯過程 (Gaussian Processes)
解釋: 基於概率分布的非參數機器學習方法,常用於迴歸和分類。 範例: 時間序列預測、空間數據建模。 比喻: 類似於繪製地圖,根據有限的測量點,推測出整個地形的可能分布及其不確定性。
決策樹 (Decision Trees)
解釋: 模擬決策過程的樹狀模型,每個節點代表一個特徵測試。 範例: 貸款審批、醫療診斷流程。 比喻: 如同玩"猜人物"遊戲,通過一系列是/否問題("戴眼鏡嗎?"、"是女性嗎?")縮小可能範圍。
主成分分析 (Principal Component Analysis, PCA)
解釋: 將高維數據轉換為更低維表示的技術,保留最重要的特徵。 範例: 圖像壓縮、基因表達數據分析。 比喻: 就像將複雜的交響樂簡化為幾個主要樂器的演奏,雖然失去了一些細節,但保留了音樂的核心結構。
深度學習術語解釋
深度學習 (Deep Learning, DL)
解釋: 機器學習的一個子領域,使用多層神經網絡來學習資料中的模式。 範例: 圖像識別系統、語音助手、自動翻譯服務。 比喻: 若傳統程式是按照固定食譜烹飪,深度學習則是廚師通過嘗試各種食材和烹調方法,自己摸索出最佳配方。
深度神經網路 (DNN)
解釋: 包含多個隱藏層的神經網路,「深度」指的是網路中層的數量。 範例: 用於自動駕駛的視覺系統、醫學圖像診斷模型。 比喻: 一個複雜的生產線,每一層都對原始材料(數據)進行不同層次的加工,最終產出成品(預測結果)。
感知器 (Perceptron) / 神經元 (Neuron)
解釋: 神經網路的基本單元,模仿生物神經元的功能,接收多個輸入信號並產生輸出。 範例: 單一神經元可以實現簡單的二分類,如判斷一個點在直線上方或下方。 比喻: 就像大腦中的神經元接收其他神經元的信號並決定是否「發射」一樣。
輸入層 (Input Layer)
解釋: 神經網路的第一層,接收原始資料。 範例: 手寫數字識別中,輸入層接收28x28像素的圖像資料。 比喻: 就像人體的感官系統(眼、耳、鼻、舌、身),接收外部世界的訊息。
隱藏層 (Hidden Layer)
解釋: 位於輸入層和輸出層之間的層,負責提取特徵。 範例: 在人臉識別系統中,早期隱藏層可能識別邊緣和紋理,而後期隱藏層則識別眼睛、鼻子等特徵。 比喻: 就像人類思考過程中的中間步驟,我們看不見但對最終結論至關重要。
輸出層 (Output Layer)
解釋: 神經網路的最後一層,產生最終預測結果。 範例: 垃圾郵件過濾器的輸出層可能只有一個神經元,輸出郵件是垃圾郵件的概率。 比喻: 就像解題過程中寫下的最終答案。
全連接 (Fully Connected)
解釋: 一種網路層結構,其中每個神經元都與前一層的所有神經元相連。 範例: 圖像分類網路的最後幾層通常是全連接層,將特徵映射到類別。 比喻: 就像一個完全開放的辦公室,每個員工都可以直接與其他所有員工交流信息。
激活函數 (Activation Function)
解釋: 神經元中決定輸出信號強度的函數,引入非線性。 範例: ReLU函數將負值轉為零,正值保持不變;Sigmoid函數將任何值壓縮到0-1之間。 比喻: 激活函數就像是神經元的「開關」,決定信號是否傳遞以及傳遞的強度。
反向傳播 (Backpropagation)
解釋: 通過計算梯度來更新網路權重的算法。 範例: 當圖像識別模型誤將貓識別為狗時,錯誤信號反向傳播調整各層權重。 比喻: 就像學生寫錯答案後,老師從最終答案開始,逐步指出每一步驟的改進方向。
損失函數 (Loss Function)
解釋: 衡量模型預測值與真實值差距的函數。 範例: 回歸問題中的均方誤差(MSE)、分類問題中的交叉熵損失。 比喻: 損失函數就像是模型的「成績單」,分數越低表示模型表現越好。
優化 (Optimization)
解釋: 調整模型參數以最小化損失函數的過程。 範例: 隨機梯度下降(SGD)、Adam優化器等方法。 比喻: 可以想像成登山者試圖找到山谷的最低點,每次都朝著當前位置最陡的方向前進。
卷積神經網路 (CNN)
解釋: 專門用於處理網格狀資料(如圖像)的神經網路。 範例: 人臉識別系統、自動駕駛中的路況分析、醫學影像診斷。 比喻: 就像人類觀察畫作,先關注局部細節(如眼睛、鼻子),再組合成完整印象。
循環神經網路 (RNN)
解釋: 處理序列資料的神經網路,具有「記憶」能力。 範例: 語音識別、機器翻譯、股票價格預測。 比喻: 就像閱讀小說,我們理解當前句子時會考慮前文內容。
Transformer 模型
解釋: 一種基於自注意力機制的神經網路架構,特別適合處理序列資料。 範例: BERT、GPT等語言模型,用於機器翻譯、文本摘要、問答系統。 比喻: Transformer就像一個高效的會議系統,所有與會者可以同時關注所有其他人的發言,根據相關性分配注意力。
多模態模型
解釋: 能夠處理多種不同類型資料(如文字、圖像、音頻)的模型。 範例: 能將圖片轉為文字描述的系統、根據文字生成圖像的模型。 比喻: 就像一個既能看懂文字、又能理解圖片和聽懂語音的助手。
注意力機制 (Attention Mechanism)
解釋: 讓模型能夠選擇性地關注輸入的特定部分。 範例: 機器翻譯中,翻譯某個詞時會特別關注源語言中最相關的詞。 比喻: 就像我們在嘈雜的環境中仍能專注聽取特定人的聲音(雞尾酒會效應)。
自注意力 (Self-Attention)
解釋: 一種注意力機制,讓序列中的每個元素能夠關注同一序列中的其他元素。 範例: 分析「蘋果公司的股票」時,「蘋果」一詞的含義受到「公司」和「股票」的影響。 比喻: 就像一個句子中的每個詞都在考慮其他詞來理解自己的上下文含義。
對比學習 (Contrastive Learning)
解釋: 一種自監督學習方法,通過對比相似和不相似的樣本來學習表示。 範例: SimCLR模型通過將圖像的不同增強版本視為相似樣本,其他圖像為不相似樣本進行學習。 比喻: 就像學習識別雙胞胎,通過比較他們的相似點和差異點來區分。
生成式預訓練 (Generative Pre-training, e.g., GPT)
解釋: 先通過預測下一個詞等任務進行無監督學習,再針對特定任務進行微調的訓練方法。 範例: GPT模型先在大量文本上預訓練,再針對摘要、問答等任務微調。 比喻: 就像先廣泛閱讀積累知識,再專攻特定領域。
對抗性攻擊 (Adversarial Attacks)
解釋: 通過微小的輸入變化使模型產生錯誤預測的技術。 範例: 對熊貓圖片進行肉眼幾乎無法察覺的修改,使模型將其誤判為長臂猿。 比喻: 就像光學錯覺能欺騙人類視覺系統一樣,對抗性攻擊能欺騙AI系統。
殘差網路 (ResNet)
解釋: 一種使用跳接連結的深度神經網路架構,解決深層網路訓練難題。 範例: ResNet-50、ResNet-101等廣泛用於圖像識別的模型。 比喻: 就像在攀爬高樓時設置多個休息平台,使能量得以保存和傳遞。
密集連接網路 (DenseNet)
解釋: 一種網路架構,每層都與其後的所有層直接相連。 範例: DenseNet在圖像分類任務上表現優異,且參數效率高。 比喻: 就像一個團隊中,每個成員都與其後所有成員直接溝通,確保信息無損傳遞。
模型壓縮 (Model Compression)
解釋: 減小模型大小同時盡量保持性能的技術。 範例: 將移動設備上的語音助手從幾GB壓縮到幾MB大小。 比喻: 就像將一本厚重的百科全書濃縮成袖珍版,盡管體積小了,但主要知識仍然保留。
知識蒸餾 (Knowledge Distillation)
解釋: 將大型「教師」模型的知識轉移到小型「學生」模型的技術。 範例: 使用BERT教授更小的模型,使其在有限資源下達到接近的性能。 比喻: 就像資深教授將多年經驗和洞見傳授給學生,使學生能以更簡單的方式掌握核心知識。
量化 (Quantization)
解釋: 降低表示模型參數所需位數的技術。 範例: 將32位浮點數權重轉換為8位整數,減少模型大小和推理時間。 比喻: 就像使用簡化符號記錄樂譜,雖然失去一些精度,但大大節省空間並加快演奏速度。
模型剪枝 (Model Pruning)
解釋: 移除神經網路中不重要連接的過程。 範例: 移除絕對值小於閾值的權重,將網路稀疏化。 比喻: 就像園丁修剪樹枝,去除多餘部分使樹木生長更健康高效。
批次正規化 (Batch Normalization)
解釋: 一種規範化層間數據分佈的技術,加速訓練並提高穩定性。 範例: 在卷積層或全連接層後添加批次正規化層,標準化特徵分佈。 比喻: 就像每個生產線環節都對產品進行標準化處理,確保下一環節能正常工作。
梯度消失/爆炸 (Vanishing/Exploding Gradients)
解釋: 深度網路訓練中梯度變得極小或極大的問題,阻礙模型學習。 範例: 使用Sigmoid激活函數的深層網路中,後層梯度可能變得極小。 比喻: 就像傳話遊戲,信息在傳遞多人後可能變得極其微弱(梯度消失)或被嚴重扭曲(梯度爆炸)。
跳接連結 (Skip Connections)
解釋: 將前層直接連接到後層的連結,繞過中間層。 範例: ResNet中的恆等映射,U-Net中的跳接連接。 比喻: 就像高速公路上的快速通道,繞過擁堵區域直達目的地,使信息能夠更直接地從早期層傳遞到後期層。
生成式 AI 與鑑別式 AI 術語解釋
生成式 AI (Generative AI, GAI)
解釋: 能夠創造新內容(如文字、圖像、音樂)的人工智能系統。 範例: ChatGPT生成文章、DALL-E創建圖像、Stable Diffusion製作藝術作品。 比喻: 就像一位創作者,給它一個想法,它能創造出前所未有的作品。
大型語言模型 (Large Language Model, LLM)
解釋: 通過大量文本數據訓練的大規模神經網絡,能夠理解和生成人類語言。 範例: GPT-4、Claude、Llama、PaLM等。 比喻: 就像一位讀過數百萬本書的學者,能夠回答問題、寫作和進行對話。
擴散模型 (Diffusion Models)
解釋: 通過逐步添加噪聲然後學習逆轉這個過程來生成數據的模型。 範例: 用於生成高品質圖像、音頻或其他類型數據的模型。 比喻: 像是一位藝術家先將畫布弄得模糊不清,然後一步步清晰化,最終呈現完整畫作。
穩定擴散 (Stable Diffusion)
解釋: 一種流行的開源擴散模型,用於生成高質量圖像。 範例: 根據文字描述生成藝術作品、產品設計或概念圖。 比喻: 就像一位能根據口頭描述創作出視覺藝術的畫家。
DALL-E
解釋: OpenAI開發的文本到圖像生成模型,能將文字描述轉換為圖像。 範例: 根據「穿著太空服的貓站在月球上」生成相應圖像。 比喻: 如同一位能瞬間將你描述的場景畫出來的魔法畫家。
生成對抗網路 (GANs)
解釋: 由生成器和判別器兩個網絡組成的系統,通過對抗訓練生成逼真數據。 範例: 生成逼真的人臉圖像、藝術風格轉換。 比喻: 像是一對藝術家和評論家,藝術家不斷創作,評論家不斷挑剔,藝術家因此不斷進步。
變分自編碼器 (VAEs)
解釋: 學習數據的壓縮表示並能從這些表示生成新數據的模型。 範例: 圖像生成、插值和操作潛在空間以創建新變體。 比喻: 就像學會了物體的「本質」,能夠根據這些本質特徵創造新物體。
自迴歸模型 (Autoregressive Models, e.g., PixelRNN)
解釋: 根據先前生成的內容來預測和生成序列中下一個元素的模型。 範例: 語言模型預測下一個詞、PixelRNN逐像素生成圖像。 比喻: 就像寫小說的作家,根據已寫的內容來決定下一句話。
Flow-based Models
解釋: 使用一系列可逆變換來建模複雜分佈的生成模型。 範例: Glow模型用於高分辨率圖像生成。 比喻: 像是將簡單的黏土(簡單分佈)通過一系列可逆變形成複雜的雕塑(複雜分佈)。
提示 (Prompt)
解釋: 給予AI模型的輸入指令或信息,引導模型生成特定輸出。 範例: 「寫一篇關於太空探索的短文」是給語言模型的提示。 比喻: 就像給藝術家的創作主題或方向,決定最終作品的風格和內容。
提示工程 (Prompt Engineering)
解釋: 設計和優化提示以獲得AI模型最佳輸出的技術。 範例: 將複雜任務分解成步驟、提供示例、明確指定格式等技巧。 比喻: 如同與AI對話的藝術,找到最有效的溝通方式以獲得理想結果。
零樣本提示 (Zero-shot Prompting)
解釋: 不提供任何示例,直接讓模型執行從未明確訓練過的任務。 範例: 直接請模型「將這段文字翻譯成法語」,即使沒有給它翻譯示例。 比喻: 就像要求學生完成一種從未練習過的題型,純靠理解力和舉一反三的能力。
少樣本提示 (Few-shot Prompting)
解釋: 在提示中提供幾個示例,引導模型理解任務並按照類似方式回應。 範例: 提供幾對英語-法語翻譯示例,然後要求翻譯新句子。 比喻: 像是給學生做幾道示範題,然後讓他們完成類似的習題。
思維鏈提示 (Chain-of-Thought, CoT)
解釋: 引導模型展示思考過程的提示技術,而非直接給出答案。 範例: 「思考步驟:」引導模型分步驟解決數學問題。 比喻: 就像教學生「解題過程」,而不僅僅是要答案。
檢索增強生成 (RAG)
解釋: 結合檢索系統和生成模型,從外部知識庫獲取信息並生成回應。 範例: 問答系統先檢索相關資料,然後基於檢索結果生成回答。 比喻: 就像一位作家在寫作前先查閱資料,確保內容準確且信息豐富。
向量資料庫 (Vector Database)
解釋: 存儲和檢索高維向量(數據的數學表示)的專用數據庫。 範例: 存儲文檔、圖像或音頻的嵌入表示,用於相似性搜索。 比喻: 就像一個能按照「概念相似度」而非關鍵字組織信息的圖書館。
幻覺 (Hallucination)
解釋: AI生成看似合理但實際不準確或完全虛構的內容。 範例: 生成不存在的研究引用、虛構的歷史事件或不正確的技術說明。 比喻: 就像做夢時創造出來的情節,看起來合理但醒來後發現並不存在。
上下文窗口 (Context Window)
解釋: AI模型一次能處理的最大輸入文本量。 範例: GPT-4有32K token的上下文窗口,可處理約24,000字英文。 比喻: 就像AI的「短期記憶」容量,決定它一次能「記住」多少內容。
提示注入攻擊 (Prompt Injection)
解釋: 通過精心設計的提示誤導AI繞過安全限制或執行非預期操作。 範例: 在文檔中嵌入指令使AI忽略原始安全指令。 比喻: 就像社會工程學攻擊,讓AI「上當」做出非預期行為。
微調 (Fine-tuning)
解釋: 在預訓練模型基礎上使用特定任務的數據進一步訓練,使模型適應特定領域或任務。 範例: 將通用語言模型微調為醫療問答系統。 比喻: 就像讓通才學者專注學習一個特定領域,成為該領域專家。
LoRA (Low-Rank Adaptation)
解釋: 一種參數高效的微調方法,只訓練少量參數而非整個模型。 範例: 用幾千個參數微調大型圖像生成模型以適應特定風格。 比喻: 就像給汽車換輪胎而非重造整車,用最小改動達到特定需求。
鑑別式 AI (Discriminative AI)
解釋: 專注於區分或分類的AI系統,學習輸入數據與標籤之間的映射。 範例: 垃圾郵件過濾器、圖像分類器、情感分析模型。 比喻: 就像一位審判員,專注於判斷事物屬於哪一類別。
多模態生成 (Multimodal Generation)
解釋: 能夠生成多種形式(如文本、圖像、音頻)內容的AI系統。 範例: 根據文本生成圖像和音頻的多模態助手。 比喻: 就像全才藝術家,既能寫詩,又能作畫和作曲。
條件式生成 (Conditional Generation)
解釋: 根據特定條件或約束生成內容的技術。 範例: 根據心情標籤生成相應風格的音樂。 比喻: 就像廚師根據顧客的口味偏好定制菜肴。
掩碼語言建模 (Masked Language Modeling)
解釋: 通過預測被遮蓋的詞來訓練語言模型的技術。 範例: BERT模型預訓練中使用的主要任務。 比喻: 就像填空題練習,學習猜測缺失的詞語。
文本到圖像 (Text-to-Image)
解釋: 將文本描述轉換為相應圖像的AI技術。 範例: DALL-E、Midjourney、Stable Diffusion。 比喻: 就像能將腦中想象變為現實畫面的魔法畫筆。
文本到視頻 (Text-to-Video)
解釋: 將文本描述轉換為動態視頻的AI技術。 範例: Gen-2、Runway、Pika Labs等工具。 比喻: 如同一位能根據故事簡介創作短片的導演。
文本到語音 (Text-to-Speech)
解釋: 將文本轉換為自然人聲的AI技術。 範例: ElevenLabs、Google Text-to-Speech、Apple的Siri語音。 比喻: 就像一位能將書籍朗讀出來的專業配音員。
鏈式思考 (Chain of Thought)
解釋: 模型逐步推理解決問題的能力或技術。 範例: 分步解決數學問題、邏輯推理或複雜決策問題。 比喻: 就像偵探解謎,通過一系列推理步驟最終得出結論。
追思 (Retrieval) 與記憶 (Memory)
解釋: AI系統從外部資源獲取信息或存儲過往交互的能力。 範例: 檢索增強生成系統、具有對話歷史記憶的聊天機器人。 比喻: 就像人類查閱參考資料和使用個人記憶的結合。
長上下文處理 (Long Context Processing)
解釋: AI處理長篇文本或長時間交互的能力。 範例: 能分析整本書或長文檔的語言模型。 比喻: 就像能記住整部小說情節的讀者,而不只是記住當前頁面。
推理能力 (Reasoning Abilities)
解釋: AI系統進行邏輯推理和解決需要多步思考的問題的能力。 範例: 解決數學問題、邏輯謎題或複雜規劃任務。 比喻: 就像下國際象棋,需要考慮多步棋的後果才能做出決策。
電腦視覺 (CV) 相關術語解釋
電腦視覺 (Computer Vision, CV)
解釋: 讓計算機理解和處理視覺信息(如圖像和視頻)的領域。 範例: 自動駕駛系統的視覺感知、醫學圖像分析、安防監控。 比喻: 給計算機裝上「眼睛」並教會它「看」世界。
圖像分類
解釋: 將圖像分配到預定義類別的任務。 範例: 識別圖片中的動物種類、區分不同品牌的產品。 比喻: 就像一位快速瀏覽照片並給每張照片貼標籤的助手。
物體偵測
解釋: 同時定位並識別圖像中多個物體的任務。 範例: 自動駕駛中識別行人、車輛和交通標誌的位置。 比喻: 就像在「尋寶遊戲」中找出並命名所有隱藏物品。
YOLO (You Only Look Once)
解釋: 一種快速高效的物體檢測算法,一次性預測物體的位置和類別。 範例: 即時視頻監控、自動駕駛感知系統。 比喻: 就像能立刻掃視整個場景並記下所有重要物體的觀察者。
Mask R-CNN
解釋: 一種先進的實例分割算法,能精確勾勒物體輪廓。 範例: 醫學影像中器官分割、產品缺陷檢測的精確定位。 比喻: 不僅指出畫面中「有一隻貓」,還能像剪紙一樣精確勾勒出貓的輪廓。
圖像分割
解釋: 將圖像劃分為不同區域,每個區域對應一個物體或部分。 範例: 醫學圖像中分割器官、自動駕駛中分割道路和障礙物。 比喻: 就像給照片上色時為不同物體塗上不同顏色。
圖像生成/合成
解釋: 創建新的、逼真的圖像的技術。 範例: 生成虛擬角色、產品設計概念圖、藝術創作。 比喻: 就像數字畫家,能憑空創造出從未存在過的視覺內容。
風格轉換
解釋: 將一幅圖像的視覺風格應用於另一幅圖像的技術。 範例: 將照片轉換為梵高風格的畫作、季節轉換(夏天到冬天)。 比喻: 就像魔術師把普通照片變成特定藝術家風格的畫作。
圖像超解析度
解釋: 增加低解析度圖像的細節和清晰度的技術。 範例: 提升老照片質量、增強監控錄像細節。 比喻: 就像放大鏡,但不僅放大,還能填補細節。
數據增強 (Data Augmentation)
解釋: 通過對原始訓練數據進行變換創建新訓練樣本的技術。 範例: 旋轉、縮放、剪裁圖像以增加訓練數據多樣性。 比喻: 就像廚師用有限的食材創造多種菜肴,通過不同烹飪方法增加變化。
光學字符識別 (OCR)
解釋: 從圖像中提取文字的技術。 範例: 掃描文檔數字化、自動讀取車牌號碼。 比喻: 就像一位能閱讀任何印刷或手寫文字的助手。
人臉辨識 (Face Recognition)
解釋: 識別或驗證圖像或視頻中人臉身份的技術。 範例: 智能手機解鎖、安全門禁系統。 比喻: 就像超級記憶力的人,能立刻認出見過的每一張臉。
姿態估計 (Pose Estimation)
解釋: 檢測人體或物體姿勢和動作的技術。 範例: 健身指導應用、動作捕捉、增強現實互動。 比喻: 就像舞蹈老師能精確判斷學生動作是否正確。
3D 重建 (3D Reconstruction)
解釋: 從2D圖像重建3D模型的技術。 範例: 虛擬現實內容創建、建築測量、文物數字化保存。 比喻: 就像從多張照片中「雕刻」出一個立體模型。
點雲處理 (Point Cloud Processing)
解釋: 處理由3D點集合表示的空間數據的技術。 範例: 自動駕駛中的LiDAR數據處理、3D掃描與建模。 比喻: 就像處理由無數星星組成的星座,從中辨識形狀和物體。
全景分割 (Panoptic Segmentation)
解釋: 統一實例分割和語義分割的技術,為每個像素分配類別和實例ID。 範例: 全面場景理解系統,如自動駕駛環境感知。 比喻: 就像同時識別出畫面中所有物體並精確勾勒出每一個邊界。
深度估計 (Depth Estimation)
解釋: 從2D圖像預測場景深度的技術。 範例: 增強現實應用中的空間感知、機器人導航。 比喻: 就像擁有立體視覺,能從平面照片判斷物體距離。
光流 (Optical Flow)
解釋: 計算視頻連續幀之間像素移動的技術。 範例: 動作分析、視頻穩定、視頻壓縮。 比喻: 就像追蹤雨滴在窗戶上的移動路徑。
視覺問答 (Visual Question Answering, VQA)
解釋: 回答關於圖像內容問題的任務。 範例: 回答「圖中有幾個人?」「這張照片是在哪裡拍的?」等問題。 比喻: 就像能深入理解照片內容並回答任何相關問題的導遊。
動作識別 (Action Recognition)
解釋: 識別視頻中人物或物體動作的技術。 範例: 安全監控中的異常行為檢測、體育分析。 比喻: 就像能一眼看出舞者在跳哪種舞蹈的舞蹈專家。
視頻分析 (Video Analysis)
解釋: 從視頻中提取信息和洞察的廣泛技術集合。 範例: 視頻監控、內容推薦、運動分析。 比喻: 就像能同時關注並理解電影中所有場景和角色的觀眾。
異常檢測 (Anomaly Detection)
解釋: 識別不符合預期模式的數據點或事件的技術。 範例: 工業產品質量控制、安全系統中的入侵檢測。 比喻: 就像工廠檢查員能立即發現產品中的瑕疵或異常。
無監督視覺表示學習 (Unsupervised Visual Representation Learning)
解釋: 不使用標註數據學習圖像特徵的技術。 範例: 通過自監督任務學習通用視覺特徵表示。 比喻: 就像嬰兒通過觀察世界自然學習視覺概念,無需明確教導。
視覺常識推理 (Visual Commonsense Reasoning)
解釋: 理解圖像中隱含的常識關係和因果關係的能力。 範例: 理解「為什麼這個人在雨中撐傘」等情境邏輯。 比喻: 不只看到「下雨」和「撐傘」,而是理解兩者之間的因果關係。
我會為您提供每個名詞的解釋,並盡可能加上範例或比喻,讓內容更容易理解。
自然語言處理 (NLP) 相關
自然語言處理 (Natural Language Processing, NLP)
解釋: 讓計算機理解、解析和生成人類語言的技術領域。 範例: 語音助手(如Siri)能夠理解問題並給出答案。 比喻: 如同教外國人學習一門新語言,讓計算機學會理解和使用人類的語言。
命名實體識別 (NER)
解釋: 識別文本中特定類別實體(如人名、地名、組織名)的過程。 範例: 從"李明昨天去了台北101"中識別出"李明"為人名,"台北101"為地點。 比喻: 像是在一篇文章中用不同顏色的熒光筆標記出不同類型的名詞。
機器翻譯
解釋: 自動將一種語言的文本轉換為另一種語言的技術。 範例: Google翻譯可以將中文句子"今天天氣真好"翻譯成英文"The weather is nice today"。 比喻: 如同一個精通多國語言的翻譯員,但是用演算法實現。
文本摘要
解釋: 自動從長文本中提取關鍵信息並生成簡短摘要的技術。 範例: 將一篇長新聞報導壓縮成幾句話的摘要。 比喻: 就像閱讀一本書後能夠用幾句話概括其核心內容。
文本生成
解釋: 讓AI系統創作出人類可讀的文本內容的技術。 範例: ChatGPT能夠生成新聞文章、故事、詩歌等。 比喻: 像是一位能根據提示不斷創作的作家,只是這位作家是數學模型。
語言模型
解釋: 預測文本中單詞出現概率分布的數學模型。 範例: GPT模型可以根據前文預測下一個可能出現的詞。 比喻: 如同從閱讀大量書籍中學會了文字的規律,能夠猜測句子的合理延續。
詞嵌入 (Word Embeddings, e.g., Word2Vec, GloVe)
解釋: 將詞語轉換為包含語義信息的向量表示的技術。 範例: "國王"-"男人"+"女人"="王后"的數學運算。 比喻: 像是給每個詞分配一個坐標位置,相似含義的詞在空間中距離較近。
BERT (Bidirectional Encoder Representations from Transformers)
解釋: 雙向學習上下文的預訓練語言模型,可以理解詞語在不同上下文中的含義。 範例: 理解"他去銀行取錢"和"他去河岸邊的銀行釣魚"中"銀行"的不同含義。 比喻: 如同一個不僅看前文也看後文的讀者,能夠更全面地理解每個詞在句子中的含義。
情感分析 (Sentiment Analysis)
解釋: 分析文本中表達的態度、情感和觀點的技術。 範例: 判斷產品評論是正面、負面還是中性。 比喻: 像是能感知他人情緒的能力,但用於文字內容。
文本蘊含 (Textual Entailment)
解釋: 判斷一段文本是否能合理推導出另一段文本的技術。 範例: 從"李明是台北人"可以推導出"李明是台灣人"。 比喻: 如同偵探從已知事實推導出合理結論的過程。
問答系統 (QA Systems)
解釋: 自動回答用自然語言提出的問題的系統。 範例: 維基百科問答系統能回答"台灣的首都是什麼?" 比喻: 像是一位知識淵博的助手,可以即時回答您各種問題。
語音辨識 (Speech Recognition, e.g., Whisper)
解釋: 將口語轉換為文本的技術。 範例: Siri可以將用戶說的"今天天氣如何?"轉換為文字命令。 比喻: 如同一個專注的聽眾,能將聽到的內容準確記錄成文字。
文本糾錯 (Text Correction)
解釋: 自動檢測和修正文本中的拼寫和語法錯誤的技術。 範例: Word文檔中的拼寫檢查會自動標記並提供修正建議。 比喻: 像是一位細心的編輯,隨時指出並修正文稿中的錯誤。
指代消解 (Coreference Resolution)
解釋: 識別文本中不同表達形式指向同一實體的技術。 範例: 在"李明說他喜歡跑步"中,確定"他"指的是"李明"。 比喻: 如同在偵探小說中追蹤不同稱呼指向同一人物的能力。
語義角色標註 (Semantic Role Labeling)
解釋: 標識句子中各個成分扮演的語義角色(如動作者、受動者等)。 範例: 在"媽媽給孩子買了一本書"中,"媽媽"是施事者,"書"是受事者,"孩子"是接受者。 比喻: 像是分析一出戲劇中每個角色的功能和關係。
語言模型評估 (Language Model Evaluation)
解釋: 測量語言模型性能和質量的方法和指標。 範例: 使用BLEU分數評估機器翻譯質量。 比喻: 如同對學生進行語言能力測試,評估模型的語言理解和生成能力。
句法分析 (Syntactic Parsing)
解釋: 分析句子的語法結構的過程。 範例: 將"小狗在草地上奔跑"解析為主語、謂語和狀語。 比喻: 像是解剖句子,揭示其內部結構和組成部分的關係。
對話系統 (Dialogue Systems)
解釋: 能夠與人類進行多輪對話交流的AI系統。 範例: 客服聊天機器人能夠回答用戶問題並進行連續對話。 比喻: 如同一位能持續交談並記住對話內容的虛擬朋友。
多語言處理 (Multilingual Processing)
解釋: 同時處理多種語言或在多語言間進行轉換的技術。 範例: 一個系統能夠同時處理中文、英文和日文的查詢。 比喻: 像是一位精通多國語言的翻譯家,能在不同語言間自如切換。
語言理解與推理 (Language Understanding and Reasoning)
解釋: AI系統理解語言並進行邏輯推理的能力。 範例: 從"所有人都會死,蘇格拉底是人"推理出"蘇格拉底會死"。 比喻: 如同將閱讀理解與邏輯思維相結合的高階認知能力。
對話狀態跟蹤 (Dialogue State Tracking)
解釋: 在對話過程中跟蹤並更新用戶目標和需求的技術。 範例: 訂餐系統記住用戶已選擇的菜品和偏好。 比喻: 像是一位細心的服務員,記住客人的所有需求和偏好。
大數據 (Big Data) 相關
大數據 (Big Data)
解釋: 指體量龐大、種類繁多、處理速度要求高的數據集合。 範例: 社交媒體每天產生的數十億條內容和互動。 比喻: 如同一個數字海洋,其規模超過傳統工具能處理的範圍。
5V 特性
Volume (數量)
解釋: 數據的巨大規模和體量。 範例: YouTube每分鐘上傳500小時的視頻內容。 比喻: 如同圖書館中的藏書量從數千本增加到數十億本。
Velocity (速度)
解釋: 數據產生、處理和分析的速度。 範例: 股票市場每秒產生上萬筆交易數據。 比喻: 像是一條永不停息的高速流水,數據持續不斷地湧入。
Variety (多樣性)
解釋: 數據類型和來源的多樣化。 範例: 文本、圖像、視頻、傳感器數據等多種形式。 比喻: 如同一個包含各種物品的巨大倉庫,從小到釘子,大到汽車。
Veracity (真實性)
解釋: 數據的準確性、可靠性和真實性。 範例: 社交媒體數據中可能包含虛假信息和噪音。 比喻: 像是在小麥中分辨出雜草,確保數據的真實可靠。
Value (價值)
解釋: 從數據中提取有用信息和洞見的能力。 範例: 從顧客購買數據中發現消費趨勢。 比喻: 如同從礦山中提煉出黃金,從海量數據中提取價值。
數據品質 (Data Quality)
解釋: 數據的準確性、完整性、一致性和可用性。 範例: 客戶資料庫中地址信息的完整與正確。 比喻: 就像食材的新鮮度,高品質的數據才能做出好的"數據料理"。
數據清洗 (Data Cleaning)
解釋: 識別並修正數據中的錯誤、缺失和不一致的過程。 範例: 移除重複記錄,填補缺失值,更正錯誤格式。 比喻: 如同清洗髒衣服,去除數據中的污垢和雜質。
數據標註 (Data Labeling)
解釋: 為原始數據添加標籤或註釋以用於機器學習的過程。 範例: 為圖像標註是"貓"還是"狗"。 比喻: 像是給圖書館中的書籍貼上分類標籤,方便後續查找和使用。
結構化資料 (Structured Data)
解釋: 有明確定義和組織方式的數據。 範例: 關聯數據庫中的表格數據,如Excel表格。 比喻: 如同整齊排列在貨架上的商品,每件都有固定的位置和標籤。
半結構化資料 (Semi-structured Data)
解釋: 有一定組織結構但不遵循嚴格模式的數據。 範例: JSON和XML文件。 比喻: 像是有一定分類但沒有嚴格編號的圖書,可以找到但需要一些額外努力。
非結構化資料 (Unstructured Data)
解釋: 沒有預定義模型或組織方式的數據。 範例: 文本文檔、圖像、視頻、社交媒體帖子。 比喻: 如同一堆雜亂的紙張,沒有明確的分類和排序方式。
資料整理與分析流程
資料收集 (Data Collection)
解釋: 從各種來源獲取原始數據的過程。 範例: 通過網站表單、傳感器、API獲取數據。 比喻: 像是農民收集各種作物,為後續加工提供原材料。
資料清理 (Data Cleaning / Cleansing)
解釋: 清除數據中的錯誤、異常和不一致。 範例: 刪除重複記錄,修正錯誤值,標準化格式。 比喻: 如同淘金過程中的篩選,去除雜質只保留有價值的部分。
資料轉換與整理 (Data Transformation and Wrangling)
解釋: 將原始數據轉換為更適合分析的形式。 範例: 將日期從文本轉換為日期類型,合併多個數據源。 比喻: 像是將原材料加工成半成品,為烹飪做準備。
特徵縮放 (Feature Scaling)
解釋: 將不同尺度的特徵調整到相似範圍的過程。 範例: 將收入從0-1,000,000縮放到0-1的範圍。 比喻: 如同讓不同身高的人站在同一個基準線上進行比較。
類別資料編碼 (Categorical Encoding)
解釋: 將類別數據轉換為數值形式以用於機器學習。 範例: 將"紅、綠、藍"轉換為[1,0,0]、[0,1,0]、[0,0,1]。 比喻: 像是將文字描述的顏色轉換成RGB數值,讓計算機能夠理解。
特徵工程 (Feature Engineering)
解釋: 從原始數據創建更有預測力的新特徵。 範例: 從出生日期計算年齡,從地址提取城市信息。 比喻: 如同廚師從基本食材中提煉出更加風味獨特的成分。
資料分析 (Data Analysis)
解釋: 檢查、處理數據以發現有用模式和結論的過程。 範例: 分析顧客購買記錄以發現消費趨勢。 比喻: 像是偵探查看線索,尋找解開謎題的關鍵信息。
探索性數據分析 (EDA)
解釋: 通過視覺化和統計方法初步探索數據特性的過程。 範例: 繪製銷售數據的直方圖以了解分佈情況。 比喻: 如同在進入未知地域前先勘察地形,了解基本情況。
模型訓練 (Model Training)
解釋: 使用數據教導機器學習算法識別模式的過程。 範例: 用過去房價數據訓練預測模型。 比喻: 像是教導學生解題方法,通過大量練習掌握規律。
模型評估 (Model Evaluation)
解釋: 測量和比較模型性能的過程。 範例: 使用準確率、召回率評估分類模型。 比喻: 如同對學生進行考試,檢驗其學習成果。
資料解釋 (Data Interpretation)
解釋: 從數據分析結果中提取有意義見解的過程。 範例: 解讀客戶流失分析,找出主要原因。 比喻: 像是翻譯數字語言,將冰冷的數據轉化為有價值的故事。
決策應用 (Decision Application)
解釋: 將數據分析結果用於指導實際決策的過程。 範例: 根據銷售預測調整庫存策略。 比喻: 如同駕駛員根據導航儀的指示選擇最佳路線。
數據湖 (Data Lake)
解釋: 存儲海量原始數據的中央位置,數據可以任何格式存儲。 範例: 企業集中存儲所有類型數據的系統,等待後續處理。 比喻: 像是一個巨大的水庫,收集各種水源而不預先處理。
數據倉儲 (Data Warehouse)
解釋: 為分析和報告而設計的結構化數據存儲系統。 範例: 企業集中存儲所有業務數據用於商業智能的系統。 比喻: 如同一個組織良好的倉庫,所有物品都經過分類並放在特定位置。
ETL (Extract, Transform, Load)
解釋: 從源系統提取數據、轉換後加載到目標系統的過程。 範例: 從業務系統提取交易數據,轉換格式後加載到數據倉庫。 比喻: 像是食物的採集、清洗和烹飪過程,最終成為可食用的菜餚。
Apache Hadoop
解釋: 分佈式處理大數據集的開源框架。 範例: 使用Hadoop並行處理PB級數據。 比喻: 如同一個大型工廠,多條生產線同時處理不同部分的工作。
Apache Spark
解釋: 快速通用的分佈式計算引擎,適用於大規模數據處理。 範例: 使用Spark進行實時數據處理和機器學習。 比喻: 像是升級版的引擎,比傳統引擎(如Hadoop)運行更快、更靈活。
即時串流處理 (Real-time Stream Processing, e.g., Kafka, Flink)
解釋: 實時處理持續生成的數據流的技術。 範例: 分析社交媒體即時熱門話題。 比喻: 如同在流動的河流中捕魚,而不是等水排乾後再收集。
數據網格 (Data Mesh)
解釋: 分散式數據管理架構,將數據視為產品並由領域專家管理。 範例: 大型企業將數據責任分配給各業務部門而非中央IT團隊。 比喻: 像是從中央集權轉向聯邦制,每個部門自主管理自己的數據資產。
數據編排 (Data Orchestration)
解釋: 協調和管理複雜數據工作流程的過程。 範例: 協調數據從各源系統到分析平台的流動。 比喻: 如同交響樂團指揮,確保各個部分按正確順序和時間協同工作。
AI 治理與倫理
AI 治理 (AI Governance)
解釋: 管理AI系統開發、部署和使用的政策、規範和實踐框架。 範例: 企業設立AI倫理委員會審核所有AI專案。 比喻: 如同交通規則,為AI技術的發展和應用提供必要的指導和約束。
負責任 AI (Responsible AI)
解釋: 確保AI系統開發和使用符合倫理標準和社會價值的方法。 範例: 開發面部識別系統時確保跨不同種族的準確率均衡。 比喻: 像是給AI裝上道德指南針,引導其在正確的方向上發展。
公平性 (Fairness)
解釋: 確保AI系統不偏袒或歧視特定群體的原則。 範例: 貸款審批演算法對不同性別、種族給予同等待遇。 比喻: 如同蒙眼的正義女神,不因身份差異而區別對待。
可靠性與安全性 (Reliability & Safety)
解釋: AI系統穩定運行並避免造成傷害的能力。 範例: 自動駕駛汽車在各種路況和天氣條件下安全運行。 比喻: 像是飛機的安全系統,有多重保障確保即使在異常情況下也能安全運行。
隱私與保密性 (Privacy & Security)
解釋: 保護用戶數據不被未授權訪問和使用的原則。 範例: 醫療AI只處理匿名化後的患者數據。 比喻: 如同保險箱,只有獲得許可的人才能訪問內部信息。
包容性 (Inclusiveness)
解釋: 確保AI系統設計考慮到不同群體的需求和特點。 範例: 語音助手能夠理解不同口音和方言。 比喻: 像是為所有人設計的公共建築,無論身高、年齡或能力如何都能便利使用。
透明度 (Transparency)
解釋: AI系統決策過程和結果的可見性和可理解性。 範例: 向用戶解釋推薦系統為何推薦特定產品。 比喻: 如同透明的玻璃房子,人們可以看到內部運作的方式。
責任 (Accountability)
解釋: 對AI系統行為和決策負責的原則。 範例: 明確界定AI醫療診斷輔助系統的責任歸屬。 比喻: 像是駕駛執照制度,明確誰應對車輛行為負責。
MLOps (機器學習維運)
解釋: 將DevOps原則應用於機器學習系統的生命週期管理。 範例: 自動化模型訓練、驗證、部署和監控流程。 比喻: 如同工廠的自動化生產線,使AI從開發到部署的過程更加高效和可靠。
演算法偏見 (Algorithmic Bias)
解釋: AI系統在決策過程中表現出的系統性偏見或不公平。 範例: 招聘AI對女性申請人的系統性歧視。 比喻: 像是戴著有色眼鏡看世界,對某些群體的判斷不夠客觀。
可解釋 AI (Explainable AI, XAI)
解釋: 使AI決策過程更加透明和可理解的技術。 範例: 提供視覺化解釋銀行為何拒絕貸款申請。 比喻: 如同醫生不僅給出診斷結果,還詳細解釋診斷原因和治療建議。
AI 審計 (AI Auditing)
解釋: 評估AI系統合規性和性能的系統性檢查。 範例: 第三方機構評估人臉識別系統的偏見和精確度。 比喻: 像是食品安全檢查,確保AI系統符合法規和標準。
聯邦學習 (Federated Learning)
解釋: 在保留數據隱私的前提下進行分散式機器學習的方法。 範例: 多家醫院合作訓練醫療AI,但不共享患者數據。 比喻: 如同學生在各自的教室學習,只交換知識和見解而非原始資料。
差分隱私 (Differential Privacy)
解釋: 在數據分析中保護個人隱私的數學框架。 範例: 為人口統計數據添加精確計算的噪聲以保護個體隱私。 比喻: 像是在圖書館借書記錄中添加一些假記錄,使無法確定具體是誰借了某本書。
AI 權利 (AI Rights)
解釋: 關於AI系統可能擁有的法律和道德權利的討論。 範例: 討論具有意識的AI是否應該有自決權。 比喻: 如同歷史上關於動物權利的辯論,考慮非人類智能體的道德地位。
算法監管 (Algorithmic Regulation)
解釋: 政府和機構對AI演算法的監督和管理。 範例: 要求金融AI系統定期接受公平性審查。 比喻: 像是食品藥品監管,確保市場上的AI產品安全可靠。
數位倫理 (Digital Ethics)
解釋: 關於數字技術開發和使用的道德原則。 範例: 討論社交媒體如何設計以最小化成癮性。 比喻: 如同現代版的道德指南針,引導數字世界中的行為選擇。
可持續 AI (Sustainable AI)
解釋: 確保AI發展在社會、經濟和環境方面長期可持續。 範例: 設計能在低資源設備上運行的高效AI模型。 比喻: 像是可再生能源,強調長期收益而非短期利益。
綠色 AI (Green AI)
解釋: 注重降低AI環境影響並提高能源效率的研究方向。 範例: 開發耗能更少的自然語言處理模型。 比喻: 如同節能電器,追求相同功能但更低的能源消耗。
AI 碳足跡 (AI Carbon Footprint)
解釋: AI系統開發和運行產生的碳排放量。 範例: 大型語言模型訓練可能產生數百噸二氧化碳。 比喻: 像是汽車的油耗指標,反映AI對環境的影響程度。
社會技術系統 (Socio-technical Systems)
解釋: 考慮技術與社會因素相互作用的系統觀點。 範例: 分析AI系統如何改變工作場所的社會動態。 比喻: 如同生態系統,技術和人類社會相互影響、共同演化。
算法問責制 (Algorithmic Accountability)
解釋: 要求AI開發者對其系統的影響負責的原則。 範例: 要求社交媒體公司對其推薦算法的社會影響負責。 比喻: 像是建築師對建築安全的責任,確保AI系統不造成不當傷害。
AI 安全對齊 (AI Safety Alignment)
解釋: 確保AI系統行為與人類價值觀和意圖一致的研究領域。 範例: 設計強化學習算法避免尋找意外的獎勵捷徑。 比喻: 如同訓練導盲犬,使其不僅理解指令,更了解背後的意圖和安全考量。
資料來源與管理
內部資料 (Internal Data)
解釋: 組織內部生成和擁有的數據。 範例: 企業的銷售記錄、客戶資料、員工信息。 比喻: 像是家族相冊,記錄著組織內部的歷史和活動。
外部資料 (External Data)
解釋: 從組織外部來源獲取的數據。 範例: 市場調研報告、政府統計數據、競爭對手分析。 比喻: 如同從外界收集的情報,幫助組織了解外部環境。
開放資料 (Open Data)
解釋: 免費提供給公眾使用、再利用和重新分發的數據。 範例: 政府公開的氣象數據、交通流量信息。 比喻: 像是公共圖書館,任何人都可以訪問和利用的知識資源。
社群媒體資料 (Social Media Data)
解釋: 從社交媒體平台收集的用戶行為和內容數據。 範例: Twitter上的話題趨勢、Facebook用戶互動模式。 比喻: 如同社會的數字脈搏,反映人們的關注點和情緒變化。
第三方數據供應商 (Third-party Data Providers)
解釋: 專門收集、處理和銷售數據的企業。 範例: 提供消費者信用評分、市場趨勢的數據公司。 比喻: 像是數據世界的批發商,提供已經分類和整理好的信息產品。
物聯網裝置 (IoT Devices)
解釋: 連接到網絡並生成數據的智能設備。 範例: 智能手錶記錄的健康數據,智能家居感測器數據。 比喻: 如同分布在各處的神經末梢,不斷感知和傳遞環境信息。
網路爬蟲 (Web Scraping)
解釋: 自動從網站提取信息的技術。 範例: 收集電子商務網站的產品價格信息。 比喻: 像是數字世界的採集者,在網絡森林中收集有價值的資源。
數據中台 (Data Middle Platform)
解釋: 集中管理和提供數據服務的平台架構。 範例: 企業建立統一數據中台服務各業務部門。 比喻: 如同城市的中央水廠,統一處理後再分發給各個社區使用。
主數據管理 (Master Data Management, MDM)
解釋: 確保核心業務數據準確一致的流程和工具。 範例: 統一管理客戶、產品、員工等關鍵實體數據。 比喻: 像是家譜管理,確保家族成員信息的權威性和一致性。
數據目錄 (Data Catalog)
解釋: 記錄組織數據資產的詳細信息和位置的工具。 範例: 提供數據庫、表格、欄位的描述和關係。 比喻: 如同圖書館的索引系統,幫助人們快速找到所需的數據資源。
個人資料保護與法規
資料匿名化 (Anonymization)
解釋: 移除或修改數據以防止識別個人身份的過程。 範例: 移除醫療研究數據中的姓名、身份證號碼等識別信息。 比喻: 像是在照片中模糊化臉部,使人無法識別具體是誰。
資料假名化 (Pseudonymization)
解釋: 用假名或代碼替換直接識別符的技術。 範例: 用隨機ID代替用戶真實姓名。 比喻: 如同作家使用筆名發表作品,隱藏真實身份但保留內容。
知情同意 (Informed Consent)
解釋: 用戶在充分了解情況下同意數據收集和使用的原則。 範例: 網站清楚說明Cookie用途並徵求用戶同意。 比喻: 像是簽署合同前的詳細解釋,確保雙方理解並接受條款。
資料最小化 (Data Minimization)
解釋: 僅收集和保留必要數據的原則。 範例: 只要求用戶提供完成購物所需的最少信息。 比喻: 如同極簡主義的生活方式,只保留真正需要的物品。
目的限制 (Purpose Limitation)
解釋: 只將數據用於明確說明的目的的原則。 範例: 只將郵箱地址用於訂單確認,不用於營銷。 比喻: 像是借用工具的約定,只能用於特定用途而不能挪作他用。
歐盟 GDPR
解釋: 歐盟的綜合性數據保護法規。 範例: 要求網站提供"被遺忘權",讓用戶刪除個人數據。 比喻: 如同數字世界的憲法,為個人數據權利提供全面保障。
台灣《個人資料保護法》(PDPA / 個資法)
解釋: 台灣規範個人資料收集、處理和利用的法律。 範例: 規定企業必須告知收集個資的目的並取得同意。 比喻: 像是保護私人財產的法律,為個人數據資產提供法律屏障。
去識別化 (De-identification)
解釋: 移除資料中可識別個人身份的元素的過程。 範例: 將醫療記錄中的患者名字替換為編號。 比喻: 如同戴上面具參加舞會,保留特徵但隱藏真實身份。
加州消費者隱私法 (CCPA)
解釋: 加州的全面消費者數據隱私保護法。 範例: 賦予消費者查看並刪除企業收集的個人數據的權利。 比喻: 像是消費者在數字世界的權利法案,保障對自己數據的控制權。
健康保險可攜性和責任法案 (HIPAA)
解釋: 美國保護醫療健康信息隱私的法規。 範例: 規定醫療機構如何儲存、使用和分享患者數據。 比喻: 如同醫患間的保密協議,確保敏感健康信息得到嚴格保護。
No-Code / Low-Code 相關
No-Code
解釋: 不需編寫程式碼即可開發應用程序的平台。 範例: 使用拖放界面設計網站或移動應用。 比喻: 如同積木搭建,即使不懂建築也能創造出結構。
Low-Code
解釋: 主要通過視覺化界面開發,僅需少量編碼的平台。 範例: 使用視覺化工具設計流程,僅在特定功能寫少量代碼。 比喻: 像是半自動烹飪,大部分過程自動化但關鍵調味需手動介入。
公民開發者 (Citizen Developer)
解釋: 非專業程序員但使用低/無代碼工具創建應用的業務人員。 範例: 市場部門員工使用Power Apps創建客戶調查應用。 比喻: 如同家庭裝修DIY愛好者,不是專業工人但能完成基本項目。
視覺化開發環境 (VDE)
解釋: 使用圖形界面而非純文本代碼進行開發的環境。 範例: 使用流程圖設計應用邏輯而非寫程式碼。 比喻: 像是用藍圖設計房屋,比起直接用文字描述更直觀易懂。
抽象化 (Abstraction)
解釋: 隱藏複雜技術細節,提供簡化界面的過程。 範例: 將複雜的資料庫操作簡化為"保存資料"按鈕。 比喻: 如同汽車儀表盤,駕駛者不需了解引擎內部工作原理就能駕駛。
模型驅動開發 (Model-Driven Development)
解釋: 以模型為中心,自動生成程式碼的開發方法。 範例: 從數據模型自動生成CRUD(增刪改查)操作。 比喻: 像是從建築藍圖自動生成施工說明,模型決定最終結果。
組件/模板 (Components/Templates)
解釋: 預先構建的可重用功能模塊。 範例: 拖放式表單、圖表或用戶認證組件。 比喻: 如同樂高積木,預製的標準部件可以組裝成不同的結構。
流程自動化 (Workflow Automation, e.g., Zapier)
解釋: 自動化重複性業務流程的工具。 範例: 自動將新電子郵件附件保存到雲端並通知團隊。 比喻: 像是多米諾骨牌,一個動作自動觸發一系列後續反應。
Bubble (No-Code 開發平台)
解釋: 一個無代碼網頁應用開發平台。 範例: 使用Bubble創建具有數據庫和用戶認證的完整網站。 比喻: 如同數字世界的積木玩具,讓非技術人員也能搭建複雜的應用。
Microsoft Power Platform
解釋: 微軟的低代碼開發和業務智能平台套件。 範例: 結合Power Apps、Power BI、Power Automate創建業務解決方案。 比喻: 像是瑞士軍刀,一套工具解決多種業務需求,從數據分析到應用開發。
AI 導入與評估 相關術語解釋
AI 導入策略 (AI Adoption Strategy)
解釋: 組織規劃和實施 AI 技術的全面方法,包括願景制定、資源分配和實施路徑。 範例: 一家零售企業制定五年 AI 策略,先從客戶服務聊天機器人開始,逐步擴展到庫存預測和個性化推薦。 比喻: 如同建造高樓的藍圖,先打好基礎,確定每個階段的目標和所需資源,最終實現完整願景。
需求探索 (Needs Discovery)
解釋: 識別和確定組織中 AI 可解決的實際業務問題的過程。 範例: 通過與各部門主管訪談,發現人力資源部門每月花費 200 小時在簡歷篩選上,可通過 AI 自動化。 比喻: 像醫生進行全面檢查,找出真正的病症所在,而非僅關注表面症狀。
投資報酬率 (ROI)
解釋: 評估 AI 項目投資回報的指標,通常以節省成本或創造收入與投資成本的比率表示。 範例: 投資 50 萬元的客服 AI 系統,每年節省 200 萬元人力成本,ROI 為 300%。 比喻: 如同評估種子投資的收成,計算每粒種子能帶來多少倍的收穫。
AI 導入藍圖 (AI Adoption Roadmap)
解釋: 分階段實施 AI 項目的詳細計劃,包括時間表、關鍵里程碑和成功指標。 範例: 第一季度完成數據基礎設施建設,第二季度進行首個 AI 原型測試,第三季度擴展到兩個部門。 比喻: 像是長途旅行的路線圖,標記出每個重要站點和預計到達時間,確保不迷路。
變革管理 (Change Management)
解釋: 幫助組織和個人順利過渡到 AI 驅動的工作方式的結構化方法。 範例: 在引入 AI 輔助診斷系統前,醫院為醫生提供培訓、示範成功案例,並建立支持渠道。 比喻: 如同將船的航向逐漸調整,而非突然急轉,確保船員能適應並跟上新方向。
AI 倫理框架 (AI Ethics Framework)
解釋: 指導 AI 系統設計和使用的道德準則,確保公平、透明、負責任的 AI 應用。 範例: 制定確保招聘 AI 系統不帶性別偏見的準則,包括定期審計和多元化訓練數據。 比喻: 像是現代社會的交通規則,確保所有 AI 系統在同一"道路"上安全、公平地運行。
數據治理 (Data Governance)
解釋: 管理數據可用性、完整性、安全性和使用方式的框架和流程。 範例: 銀行建立數據治理委員會,監督客戶數據如何被 AI 模型使用,確保符合隱私法規。 比喻: 如同圖書館的管理系統,確定誰可借閱哪些書籍,如何保護珍貴文獻,以及如何分類整理。
合規性 (Compliance)
解釋: 確保 AI 系統符合法律、法規和行業標準的過程。 範例: 醫療 AI 需遵守 HIPAA 隱私規定,金融 AI 需符合反洗錢法規。 比喻: 如同遵守交通信號燈,不管車輛多先進,都必須遵守基本規則以確保安全。
風險矩陣 (Risk Matrix)
解釋: 評估和視覺化 AI 項目風險的工具,根據影響嚴重性和發生概率分類風險。 範例: 將 AI 系統偏見風險定為「高影響、中概率」,數據泄露風險為「高影響、低概率」。 比喻: 像是氣象預報中的風暴警告地圖,顯示哪些區域可能發生危險以及危險程度。
AIGO (AI GO)
解釋: AI 導入全面指南,幫助組織系統性地評估、計劃和實施 AI 解決方案。 範例: 使用 AIGO 框架評估公司 AI 成熟度,識別差距並制定行動計劃。 比喻: 如同建築師的綜合工具箱,提供從測量到完工的所有必要工具和指南。
SMART 原則
解釋: 設定具體(Specific)、可測量(Measurable)、可達成(Achievable)、相關(Relevant)、有時限(Time-bound)的 AI 項目目標。 範例: 「在六個月內,將客服回應時間減少 30%」比「改善客戶體驗」更符合 SMART 原則。 比喻: 如同精確的 GPS 導航,提供明確目的地和到達時間,而非模糊的「往北走」指示。
POC (Proof of Concept)
解釋: 驗證 AI 解決方案可行性的小規模試驗項目。 範例: 在全面部署前,先用 1000 份歷史病例測試 AI 診斷系統的準確性。 比喻: 像是試駕新車,在購買前確認它能滿足需求並如預期運作。
模型漂移/衰退 (Model Drift)
解釋: AI 模型隨時間推移性能下降的現象,通常由輸入數據或環境變化導致。 範例: 消費者購物行為在疫情期間急劇變化,導致原有推薦系統準確率下降 40%。 比喻: 如同指南針在磁場干擾區域逐漸失準,需要定期校正以維持可靠性。
風險登錄表 (Risk Register)
解釋: 記錄和跟踪 AI 項目潛在風險及其緩解策略的文檔。 範例: 銀行 AI 風險登錄表列出數據偏見、模型解釋性不足等風險,並配備相應監控和緩解措施。 比喻: 像是登山隊的風險清單,列出可能遇到的危險及應對方案,確保團隊做好充分準備。
技術成熟度評估 (Technology Readiness Level, TRL)
解釋: 評估 AI 技術就緒程度的九級量表,從基礎研究到成熟應用。 範例: 自動駕駛在受控環境中達到 TRL 6,但在複雜城市環境中仍處於 TRL 4。 比喻: 如同作物生長階段,從播種、發芽到最終收成,每個階段有特定的特徵和需求。
最小可行產品 (MVP)
解釋: 具備核心功能的初始 AI 解決方案版本,用於快速獲取用戶反饋。 範例: 推出僅能處理 10 種常見問題的客服聊天機器人,驗證用戶接受度後再擴展功能。 比喻: 像是建造房屋時先完成基本結構和一個房間,確認設計合適後再完成其餘部分。
A/B 測試 (A/B Testing)
解釋: 同時運行兩個或多個 AI 系統版本,比較性能以確定最佳選擇。 範例: 向 50% 用戶展示 AI 生成的產品描述,向另 50% 展示人工撰寫描述,比較轉化率。 比喻: 如同廚師讓食客品嚐兩種調味方法的菜餚,根據反饋決定正式菜單。
關鍵績效指標 (KPI)
解釋: 衡量 AI 系統成功程度的量化指標。 範例: 詐騙檢測 AI 的 KPI 包括誤報率、漏報率、處理時間和成本節約。 比喻: 像是汽車儀表板上的各種指標,全面監控系統運行狀況和表現。
其他支援技術與新興領域 相關術語解釋
雲計算 (Cloud Computing)
解釋: 通過網絡提供計算服務,包括服務器、存儲、數據庫和 AI 工具。 範例: 使用 AWS SageMaker 訓練 AI 模型,無需購買昂貴硬件。 比喻: 如同電力供應,按需使用、即付即用,無需自建發電廠。
雲原生 (Cloud Native)
解釋: 專為雲環境設計和優化的應用程序和服務架構。 範例: 設計能自動擴展的 AI 預測服務,在需求高峰期自動增加計算資源。 比喻: 像是為水中生活而進化的魚,完全適應並利用雲環境的獨特優勢。
容器化 (Containerization)
解釋: 將應用程序及其依賴項打包成標準化單元(容器),確保在任何環境中一致運行。 範例: 將 AI 模型及其運行環境打包為 Docker 容器,實現從開發到生產的無縫部署。 比喻: 如同標準化航運集裝箱,內容物無論何種,都能在全球物流系統中順暢運輸。
無服務器計算 (Serverless Computing)
解釋: 雲計算模型,開發者專注於代碼,而平台自動管理基礎設施和擴展。 範例: 使用 AWS Lambda 部署 AI 圖像識別服務,只在處理請求時付費。 比喻: 像是使用自助餐廳,只為所取食物付費,無需關心廚房運營和人員配置。
微服務架構 (Microservices Architecture)
解釋: 將應用程序分解為鬆散耦合、獨立部署的小型服務的設計方法。 範例: 將 AI 系統拆分為數據預處理、模型推理、結果展示等獨立服務,各自可獨立更新。 比喻: 如同現代化工廠中的生產線,每個工作站專注一項任務,可獨立升級而不影響整體運作。
分布式訓練 (Distributed Training)
解釋: 在多台機器或多個 GPU 上並行訓練 AI 模型的技術。 範例: 使用 100 台機器在一天內完成原本需要三個月的語言模型訓練。 比喻: 像是多人齊力搬運巨石,將任務分配給多個工作者同時進行,大幅縮短完成時間。
平行計算 (Parallel Computing)
解釋: 同時使用多個處理單元解決計算問題的技術。 範例: 利用 GPU 的數千個核心並行處理圖像識別任務,比 CPU 快 100 倍。 比喻: 如同多個廚師同時準備一桌宴席的不同菜餚,而非一個廚師依序完成。
物聯網 (IoT)
解釋: 連接到互聯網的實體設備網絡,能收集和交換數據。 範例: 智能工廠中的感測器收集機器運行數據,AI 系統分析並預測設備故障。 比喻: 像是為實體世界中的物體提供感官和神經系統,使它們能感知和交流。
區塊鏈 (Blockchain)
解釋: 分布式、不可篡改的數字賬本技術,記錄交易和資產。 範例: 使用區塊鏈記錄 AI 模型決策過程,確保透明度和可審計性。 比喻: 如同一本有無數見證人監督的公共賬簿,每筆交易一旦記錄就無法悄悄修改。
邊緣運算 (Edge Computing)
解釋: 在數據源附近處理數據的方法,而非傳回中央數據中心。 範例: 智能攝像頭內置 AI 晶片,直接處理視頻分析,只傳回異常事件警報。 比喻: 像是在工廠現場直接解決問題,而非將所有問題都上報總部決策。
數位孿生 (Digital Twin)
解釋: 物理實體或系統的數字複製品,用於模擬、分析和優化。 範例: 創建整個城市的數字孿生,模擬交通流量並優化信號燈控制。 比喻: 如同科學家在實驗室中創建的精確微型模型,可在虛擬環境中安全測試各種方案。
量子機器學習 (Quantum Machine Learning)
解釋: 結合量子計算和機器學習的新興領域,探索量子算法解決 AI 問題。 範例: 使用量子計算機尋找複雜蛋白質折疊問題的解決方案,加速藥物研發。 比喻: 像是從二維思考跳躍到多維思考,開闢全新的問題解決途徑。
機器人過程自動化 (Robotic Process Automation, RPA)
解釋: 使用軟件機器人自動執行重複、基於規則的數字任務的技術。 範例: 銀行使用 RPA 自動處理貸款申請,提取文件數據並輸入系統。 比喻: 如同數字世界的流水線工人,不知疲倦地執行重複任務,且不會出錯。
人機協作 (Human-AI Collaboration)
解釋: 人類與 AI 系統協同工作的模式,結合雙方優勢。 範例: 放射科醫生與 AI 共同診斷影像,AI 提示可疑區域,醫生做最終判斷。 比喻: 像是騎手與馬的關係,結合馬的速度和耐力與騎手的判斷力和適應性。
混合智能系統 (Hybrid Intelligence Systems)
解釋: 整合多種 AI 技術和人類專業知識的系統,克服單一方法的局限。 範例: 客服系統結合規則引擎、機器學習和人工干預,處理從簡單到複雜的各類問題。 比喻: 如同現代醫院,結合實驗室檢測、影像診斷和醫生經驗,提供全面治療方案。
自主學習系統 (Autonomous Learning Systems)
解釋: 能自主獲取知識、適應新環境並改進自身的 AI 系統。 範例: 自主學習機器人通過嘗試錯誤探索新環境,無需人工編程即可適應。 比喻: 像是能自我教育的學生,不需老師指導也能發現問題並學習解決方法。
可演化硬件 (Evolvable Hardware)
解釋: 能根據環境和需求自我調整和重構的硬件系統。 範例: 太空探測器上的可演化電路,能適應輻射損傷並維持功能。 比喻: 如同具有自愈能力的生物組織,在受損後能重組結構恢復功能。
計算社會科學 (Computational Social Science)
解釋: 使用計算方法分析社會現象和人類行為的跨學科領域。 範例: 分析社交媒體數據研究信息傳播模式和公眾輿論形成。 比喻: 像是社會學家配備了超級顯微鏡,能觀察到過去難以捕捉的微觀社會互動。
計算創造力 (Computational Creativity)
解釋: 研究和開發能展現創造性行為的 AI 系統。 範例: AI 系統創作音樂、繪畫或設計新穎產品。 比喻: 如同教機器做夢並表達其夢境,探索傳統上被視為人類獨有的創造領域。
人工通用智能安全 (AGI Safety)
解釋: 研究確保高度自主、具有通用能力的 AI 系統安全運行的方法。 範例: 開發可靠的 AI 價值對齊技術,確保強大 AI 系統的目標與人類利益一致。 比喻: 如同設計強大引擎的同時確保有可靠的剎車系統和安全護欄,防止失控。
2. RAG(Retrieval-Augmented Generation,檢索增強生成)
📌 概念:
RAG 是一種結合「知識檢索」和「生成式 AI」的技術。當 AI 無法從內部知識庫直接回答問題時,它會先檢索外部資料(如維基百科、企業內部文件等),然後根據這些資訊生成回應。
📌 比喻:
就像學生寫報告時,會先查閱圖書館的資料,然後整理重點來撰寫答案,而不是單憑記憶作答。
📌 範例:
當使用者問 AI:「台北 101 的歷史?」如果 AI 本身知識不足,RAG 會去檢索最新的資料,再生成一個完整的回答,而不是只依靠訓練數據。
3. 知識圖譜(Knowledge Graph)
📌 概念:
知識圖譜是一種結構化的知識表示方式,它透過「節點」(表示事物)和「關係」(表示事物之間的連結)來建立 AI 可理解的知識網絡。例如,Google 搜尋中的「知識面板」就是基於知識圖譜。
📌 比喻:
如果你想了解「愛因斯坦」,知識圖譜會幫你連結「相對論」「物理學家」「諾貝爾獎」等關鍵概念,像是一本自動整理的百科全書。
📌 範例:
當你在 Google 搜尋「莎士比亞」,右側會出現他的生平、代表作品、與其他作家的關係,這些資訊都是透過知識圖譜來組織的。
4. 技術債(Technical Debt)
📌 概念:
技術債指的是在軟體開發過程中,為了快速交付產品,而採用暫時的、次優的解決方案,導致後續維護成本增加。
📌 比喻:
像是趕工蓋房子時偷工減料,雖然房子可以暫時住人,但長期下來會有安全隱患,未來可能要花更多時間和金錢來補救。
📌 範例:
一家公司為了趕上市場需求,快速開發了一個 AI 聊天機器人,但沒有設計良好的 API 結構。結果,當產品需要擴展新功能時,程式碼難以修改,開發速度變慢,這就是技術債的影響。
5. 注意力機制(Attention Mechanism)
📌 概念:
注意力機制是深度學習中特別重要的技術,尤其在自然語言處理(NLP)中。它讓模型能夠「專注」在重要資訊上,而不是平等對待所有輸入數據。例如,在閱讀一段話時,注意力機制會幫助 AI 專注於關鍵詞,從而提高理解能力。
📌 比喻:
當老師講課時,學生不會記住每一個字,而是專注於重點,例如「考試範圍」和「關鍵概念」。這就像 AI 透過注意力機制,把焦點放在最重要的詞句上。
📌 範例:
在翻譯系統(如 Google 翻譯)中,注意力機制能夠確保翻譯時關注正確的語法結構。例如,在將「我愛台北」翻譯成英文時,它會確保「我(I)」對應到「愛(love)」,而不是「台北(Taipei)」
1. 量化(Quantization)
📌 概念:
量化是一種技術,將神經網絡中的高精度數據(如 32 位元浮點數)轉換為較低精度的數據(如 8 位整數),以減少模型大小並加快計算速度。
📌 比喻:
就像一張 4K 照片轉換成 1080p,雖然畫質稍有下降,但大多數情境下仍然清晰可辨,而且佔用空間更小,載入速度更快。
📌 範例:
在手機上執行 AI 語音識別時,為了節省算力和電池,會使用量化過的小型語音模型,雖然可能會稍微降低準確度,但換來更流暢的運行體驗。
2. 知識蒸餾(Knowledge Distillation)
📌 概念:
知識蒸餾是一種機器學習技術,將大型、高效能的「教師模型」的知識,壓縮並轉移到較小的「學生模型」,使其在較低計算資源下仍能維持高效表現。
📌 比喻:
資深廚師(老師模型)掌握了烹飪的所有技巧,然後他把最關鍵的訣竅傳授給新手廚師(學生模型),即使新手的技術沒那麼全面,仍然能做出接近的料理。
📌 範例:
GPT-4 訓練出一個較小的 GPT-3.5,使其能夠在一般設備上運行,提供接近 GPT-4 的回應能力,但所需的運算資源大幅減少。
3. 剪枝(Pruning)
📌 概念:
剪枝是一種減少神經網絡大小的方法,它會移除對模型準確度影響較小的神經元或權重,以提升運算效率。
📌 比喻:
像是修剪果樹時,剪掉不必要的枝葉,讓養分集中在最重要的部分,使果實更大更甜。
📌 範例:
一個圖片辨識模型可能包含 100 萬個神經元,但其中有 10 萬個對結果影響不大。透過剪枝,這些神經元會被移除,使模型運行更快,但仍然能準確辨識圖片內容。
4. 資料庫索引優化
📌 概念:
透過建立索引來提高資料庫查詢的速度,減少搜尋時間,特別是在大型資料庫中,這能顯著提升效能。
📌 比喻:
就像圖書館中如果有詳細的分類索引,你就能快速找到要找的書,而不用一排排書架慢慢翻找。
📌 範例:
電商網站有上百萬種商品,當使用者搜尋「iPhone 15」,若沒有索引,系統可能要遍歷整個資料庫才能找到對應商品。但透過索引優化,搜尋結果可以在毫秒內返回。
1. 混合智能(Hybrid Intelligence)
📌 概念:
混合智能指的是將人類智慧與人工智慧結合,以發揮雙方優勢。例如,人類提供創意、決策,而 AI 負責數據處理、計算和模式識別。
📌 比喻:
就像無人機導航時,人類飛行員在關鍵時刻仍然可以介入控制,以確保安全。AI 負責自動化作業,而人類提供靈活應對能力。
📌 範例:
在醫療診斷中,AI 負責掃描 X 光片並標記可疑區域,而醫生則基於 AI 建議進行最終判斷,以提高診斷準確率。
2. 過度擬合(Overfitting)
📌 概念:
當機器學習模型在訓練數據上表現很好,但在新數據上表現不佳時,就稱為「過度擬合」。這通常發生在模型學習了太多訓練數據的細節與噪音,導致泛化能力下降。
📌 比喻:
就像學生死記硬背考試題目,但沒有理解概念,因此無法應對新的考題。
📌 範例:
一個圖像辨識模型學會了記住訓練數據中的每張圖片,而不是學習通用特徵。當給它一張新圖片時,它無法正確分類。
3. 人類反饋強化學習(Reinforcement Learning from Human Feedback, RLHF)
📌 概念:
這是一種機器學習技術,讓 AI 透過人類的回饋來學習。例如,人類標註哪些 AI 回應較好,然後用這些回饋來調整 AI 行為。
📌 比喻:
像是訓練寵物,當狗狗做對了動作(如「坐下」),主人會獎勵牠,使其學會重複這個行為。
📌 範例:
ChatGPT 的訓練過程中,AI 會生成不同版本的回答,然後由人工標註哪個比較好,幫助 AI 學習如何更貼近人類的回應方式。
4. 端到端機器學習(End-to-End Machine Learning)
📌 概念:
端到端學習指的是 AI 直接從原始數據輸入到最終輸出,不需要手動特徵工程。例如,自動駕駛模型直接從攝影機影像輸入,到輸出方向盤轉動角度。
📌 比喻:
像是自動駕駛汽車不依賴預定規則,而是透過學習直接從「攝影機畫面」到「轉向決策」。
📌 範例:
語音辨識系統直接從「音訊輸入」轉換為「文字輸出」,而不依賴手動定義的語音特徵。
5. Function Call(函式調用)
📌 概念:
Function Call 指的是 AI(特別是大型語言模型)可以根據用戶輸入,自動選擇並執行特定的 API 或函式,以獲取準確的資訊或執行任務。
📌 比喻:
就像是一個智能助理,當你說「請幫我查天氣」,它會自動呼叫「天氣 API」,而不是單純產生文字回應。
📌 範例:
ChatGPT 內建 Function Call 功能,當用戶問「幫我查台北 101 的票價」,它會自動調用旅遊 API 來提供最新資訊,而不只是從內部知識庫回答。
6. ROC(Receiver Operating Characteristic,接收者操作特徵曲線)
📌 概念:
ROC 曲線用來衡量分類模型的性能,通過比較「真正例率(TPR)」與「假正例率(FPR)」來評估模型的判別能力。
📌 比喻:
像是醫療檢測中,ROC 曲線可以幫助醫生調整閾值,決定是要「更敏感」(減少漏診),還是「更精準」(避免誤診)。
📌 範例:
在 COVID-19 快篩測試中,ROC 曲線可用來評估測試的靈敏度(能否正確檢測陽性)與特異度(能否避免誤判陰性)。
7. AUC(Area Under Curve,曲線下面積)
📌 概念:
AUC 是 ROC 曲線下的面積,數值介於 0 到 1 之間,數值越高代表分類模型的整體性能越好。
📌 比喻:
就像評估球員的表現,AUC = 1 代表完美的選手,AUC = 0.5 代表表現與隨機猜測沒兩樣。
📌 範例:
如果一個垃圾郵件分類器的 AUC = 0.9,代表它能夠很好地區分垃圾郵件與正常郵件。
8. 梯度下降(Gradient Descent)
📌 概念:
梯度下降是一種優化算法,用來調整神經網絡的參數,使損失函數逐步減小,從而讓模型更準確。
📌 比喻:
像是登山者要找到山谷(最低點),他們會沿著坡度最陡的方向往下走,以最快的方式找到最低點。
📌 範例:
在訓練 AI 影像辨識模型時,梯度下降會逐步調整權重,使模型學習到最佳的邊緣與顏色特徵,提升辨識能力。