L111 人工智慧概念
人工智慧 (AI)
AI就像是教電腦模仿人類的思考和行為,讓它們能學習、推理、解決問題、感知環境,甚至聽懂人話。像是手機裡的語音助手、自動駕駛汽車、圍棋高手AlphaGo都是AI的應用。
弱人工智慧 (Weak AI)
弱AI就像是只會做特定事情的專家,例如掃地機器人只會掃地,天氣預報系統只會預測天氣,推薦系統只會推薦東西。它們很厲害,但只在特定領域有用,沒有真正的思考能力。
強(通用)人工智慧 (Strong AI / AGI)
強AI就像是超級聰明的全能學生,能像人類一樣學習各種知識,並應用到不同領域。不過,現在還沒有真正的強AI,只能在科幻電影裡看到。
超人工智慧 (Super AI)
超AI比強AI更厲害,就像擁有超能力的大腦,能解決所有人類能解決的問題,甚至處理我們無法理解的複雜難題。這目前還只是想像。
圖靈測試 (Turing Test)
圖靈測試就像一場文字版的猜謎遊戲。如果AI透過文字對話,能讓人誤以為它是人類,就算通過測試,代表它展現了類似人類的智能。
智能客服 (Chatbot)
Chatbot就像是數位世界的接待員,能聽懂我們平常說話的方式,回答問題或幫忙做簡單的事情。像是網站上的線上客服或ChatGPT都算Chatbot。
理性行動 (Acting Rationally)
理性行動是指AI會根據它知道的所有資訊,做出最合理、最能達成目標的決定,不會被情緒或隨機因素影響。就像導航系統總是選最快的路。
智慧代理 (Intelligent Agents)
智慧代理就像是能感知環境、自己做決定並採取行動來達成目標的自主個體。可以是軟體(像網路爬蟲)或硬體(像機器人)。就像管家看到髒了會自己打掃。
AI Agent (人工智慧代理)
AI Agent更強調這個代理是用AI技術來感知、思考和行動。像是Siri或Google Assistant,能聽懂你的指令並自主完成任務。
符號主義 AI (Symbolic AI)
符號主義AI認為人類智能來自於對符號(文字、概念)的操作和推理。所以它試圖在電腦裡建立符號系統和規則來模仿思考。就像電腦嚴格按照食譜做菜。
專家系統 (Expert System)
專家系統就像是把一位專家的知識裝進電腦,當你問問題時,它會用這些知識來推理並給你建議。像是早期輔助醫生診斷的系統。
認知計算 (Cognitive Computing)
認知計算更像是教電腦像人一樣思考、理解和學習,整合各種AI技術來理解複雜資訊,從經驗學習,並與人類自然互動。像是IBM的Watson系統。
機器智慧 (Machine Intelligence)
機器智慧強調機器自己展現出的智能行為,特別是它們透過互動學習和適應的能力。就像棋類程式越下越厲害。
自主系統 (Autonomous Systems)
自主系統就像是能獨立運作,不需要人類干預就能感知環境、做決定和執行任務的系統。像是自動駕駛車或無人機。
知識表示 (Knowledge Representation)
知識表示就像是為電腦創建一本結構化的「百科全書」,用特定的方式組織知識,讓AI能理解並用來推理和決策。
框架理論 (Frame Theory)
框架理論就像是建立很多預設的「表格」(框架),用來描述不同概念的典型知識。表格裡有很多「欄位」(槽位),記錄相關的屬性和特徵。例如描述「去餐廳吃飯」的框架。
視覺常識推理 (Visual Commonsense Reasoning)
視覺常識推理是指AI不只看到圖像中的東西,還能理解它們之間隱含的常識關係和邏輯。就像我們看圖說故事,能理解畫面背後的原因和可能的發展。
語言理解與推理 (Language Understanding and Reasoning)
語言理解與推理是指AI不只看懂字面意思,還能理解深層的含義和邏輯,並進行推理。例如從「所有人都會死」和「蘇格拉底是人」推導出「蘇格拉底會死」。
推理能力 (Reasoning Abilities)
推理能力是AI運用知識和資訊,透過邏輯或其他方式得出新結論或解決複雜問題的能力。就像下棋時要預想好幾步。
人機協作 (Human-AI Collaboration)
人機協作是指人類和AI一起合作完成任務。AI擅長處理數據和快速計算,人類擁有常識和創造力。就像醫生和AI一起判讀X光片。
混合智能系統 (Hybrid Intelligence Systems)
混合智能系統會整合多種不同的AI技術,有時也會結合人類的知識,來解決複雜的問題。就像客服系統會根據問題的難度,用不同的AI或轉接給真人。
自主學習系統 (Autonomous Learning Systems)
自主學習系統能在沒有太多人類指導的情況下,自己從環境或數據中學習和改進。就像探索機器人自己學會走路。
計算創造力 (Computational Creativity)
計算創造力是指AI能展現出類似人類的創造性行為,例如創作音樂、繪畫、寫詩等。就像教電腦「做夢」並表達出來。
人工通用智能安全 (AGI Safety)
AGI Safety 研究如何確保未來非常聰明的AI系統能夠安全、可控,並且目標與人類利益一致,避免失控的風險。就像為超級跑車設計可靠的剎車系統。
知識圖譜 (Knowledge Graph)
知識圖譜就像是一個「超級鏈接版」的百科全書,用圖的結構來表示實體(人、地點、概念)以及它們之間的關係,讓AI更容易理解事物之間的聯繫。就像Google搜尋結果右側的信息框。
深度研究 (Deep Research)
深度研究是指系統性、深入地挖掘資料、分析數據、探索理論,長時間專注於某個主題。就像考古學家深入挖掘遺址。
深度搜尋 (Deep Search)
深度搜尋是利用AI技術進行更強大的信息檢索,不只找關鍵字,更能理解你的意圖,整合多方資訊,提供更精確的答案。就像經驗豐富的情報分析師。
L112 資料處理與分析概念
標註資料 (Labeled Data)
就像練習題附有答案,標註資料包含輸入和對應的「正確答案」(標籤)。AI(監督式學習)就看著這些學習。例如,病人的症狀(輸入)和醫生的診斷(標籤)。
未標註數據 (Unlabeled Data)
只有輸入,沒有正確答案的資料。就像你拿到一堆舊照片(特徵),但不知道哪些是「生日」,哪些是「畢業」。AI 需要自己找規律。這種資料量通常很大。
大數據 (Big Data)
不只是「很多」數據,而是量非常大、種類多、產生和處理速度都很快的數據集合。像社群媒體每天產生的數據就是。我們要用更強大的工具才能處理分析這個「數字海洋」。
大數據的 5V 特性
Volume (數量): 數據量巨大。像 YouTube 每分鐘上傳的影片時長。
Velocity (速度): 數據產生和流動速度快。像股票市場的交易數據。
Variety (多樣性): 數據類型多樣,如文字、圖片、影片等。像一個什麼都有的超級倉庫。
Veracity (真實性): 數據的準確性和可靠性。要像篩選小麥挑出雜草。
Value (價值): 從數據中提取出的有用信息和商業價值。像從礦山提煉黃金。
數據品質 (Data Quality)
衡量數據好壞的標準,包含準確性、完整性、一致性、及時性和可用性。高品質數據是有效分析和可靠 AI 模型的基礎。就像做菜要用新鮮食材。
數據清洗 (Data Cleaning)
修正或移除數據中的錯誤、不完整、不一致、重複或格式問題,提高數據品質。就像洗髒衣服去除污漬。
數據標註 (Data Labeling)
為原始數據添加有意義的標籤,讓 AI 模型能夠理解和學習。就像為圖書館的書貼上分類標籤。
結構化資料 (Structured Data)
有明確定義和組織的數據,通常存儲在表格中(如 Excel、數據庫)。像超市貨架上整齊排列的商品。
半結構化資料 (Semi-structured Data)
不像表格嚴格,但包含標籤或標記來分隔數據元素(如 JSON、XML)。像圖書館按主題分區擺放的書。
非結構化資料 (Unstructured Data)
沒有固定格式或組織方式的數據(如文檔、照片、影片)。像隨意堆放的文件和筆記。
資料收集 (Data Collection)
從不同來源獲取原始數據的過程。像農民收集作物。
資料清理 (Data Cleaning / Cleansing)
再次強調,處理數據中的錯誤、異常值、不一致性、缺失值和重複項,提高數據品質。像淘金去除沙石。
資料轉換與整理 (Data Transformation and Wrangling)
將清理後的數據轉換成更適合分析和建模的形式,改變數據結構、格式或數值。Data Wrangling 更強調靈活性。像廚師加工食材。
特徵縮放 (Feature Scaling)
將不同特徵的數值範圍調整到相似的尺度,避免某些特徵影響過大。就像比較身高和體重前先標準化。
類別資料編碼 (Categorical Encoding)
將非數值型的類別數據轉換成數值形式,讓模型可以處理(如獨熱編碼)。就像用RGB值表示顏色讓電腦理解。
資料分析 (Data Analysis)
運用統計方法、工具和邏輯思維,檢查、清洗、轉換和建模數據,從中發現信息、模式、洞見,檢驗假設並得出結論。像偵探分析線索破案。
探索性數據分析 (Exploratory Data Analysis, EDA)
在正式分析前,用視覺化和簡單統計量初步探索和理解數據特性、分佈和關係,為後續分析指引方向。像探險前先研究地圖。
資料解釋 (Data Interpretation)
從數據分析結果中提取有意義的見解和結論,並轉化為可理解和操作的信息。像翻譯數字語言變成大家聽得懂的故事。
數據湖 (Data Lake)
集中式儲存庫,可以以原始格式儲存各種結構化和非結構化數據,需要時再定義用途(Schema-on-Read)。像一個收集各種水源的天然水庫。
數據倉儲 (Data Warehouse)
專門為商業智能設計的數據儲存系統,通常只儲存經過處理和整合的結構化數據,為了特定分析目的而組織(Schema-on-Write)。像一個精心組織的現代化倉庫。
ETL (Extract, Transform, Load)
將數據從來源提取、轉換處理後加載到目標系統(通常是數據倉儲)的標準流程。像準備一頓飯的採買、處理和烹飪過程。
數據網格 (Data Mesh)
分散式的數據架構和組織方法,將數據的所有權和責任下放給產生數據的業務部門,將數據視為「產品」。像國家的分權治理。
數據編排 (Data Orchestration)
自動化地協調、調度和管理一系列複雜的、相互依賴的數據任務或工作流程。像指揮一個大型交響樂團。
內部資料 (Internal Data)
組織或企業內部產生和擁有的數據。像家庭相冊或日記。
外部資料 (External Data)
從組織自身以外的來源獲取的數據。像國家收集的情報或市場調研。
開放資料 (Open Data)
政府、組織等以開放授權免費提供的數據,供公眾自由使用。像公共圖書館或開放的知識庫。
社群媒體資料 (Social Media Data)
從社群媒體平台收集的用戶內容和互動數據。像觀察社會大眾思想動態的數字窗口。
第三方數據供應商 (Third-party Data Providers)
專門收集、處理和銷售數據給其他企業的公司。像數據世界的批發商或零售商。
網路爬蟲 (Web Scraping)
自動化程序,模擬瀏覽網頁行為,從網頁提取所需信息。像數字世界的採集者或蜜蜂。
數據中台 (Data Middle Platform)
介於底層數據基礎設施和上層業務應用之間的中間平台架構,沉澱、整合和複用數據能力,以標準化、服務化的方式支持業務需求。像城市的中央廚房或供水廠。
主數據管理 (Master Data Management, MDM)
確保企業核心數據(如客戶、產品信息)在所有系統中保持準確、一致、完整和權威的業務流程和技術。像管理龐大家族的權威家譜。
數據目錄 (Data Catalog)
組織化的數據資產清單和元數據管理工具,幫助用戶找到、理解和信任所需的數據。像大型圖書館的詳細索引系統。
資料庫索引優化 (Database Index Optimization)
通過合理創建、維護和使用索引,顯著提高數據庫查詢速度和效率。像書後面的索引或圖書館的分類卡片索引。
L113 機器學習概念
機器學習 (ML)
簡單說,機器學習是讓電腦從數據中學習、進步的科學,不用我們針對每種情況寫死規則。就像教小朋友認水果,不是鉅細靡遺地描述,而是給他看各種水果,讓他自己觀察學習。生活中常見的垃圾郵件過濾器、語音辨識、影片推薦等,背後都有機器學習。
監督式學習 (Supervised Learning)
學習時有「指導」,我們提供「已標記的訓練數據」,包含「問題」(輸入特徵)和「標準答案」(標記)。例如預測房價,提供房屋大小、地點等特徵,以及對應的實際售價(標記)。像學生在學校學習,老師(標籤)會告訴你對錯。主要任務有兩種:
分類 (Classification)
將數據分到預先定義好的「類別」。例如判斷郵件是「垃圾」或「非垃圾」,像郵局分揀信件。
迴歸 (Regression)
預測一個「連續的數值」。例如預測房價或明天的氣溫,像估計一個人的體重。
標記 (Label)
監督式學習中,我們希望模型預測的目標值,是數據的「標準答案」。像商品上的價格標籤,告訴你價值或類別。
非監督式學習 (Unsupervised Learning)
學習時沒有「標準答案」或標籤,電腦自己從「未標記數據」中尋找結構、模式。例如電商分析客戶群、銀行檢測可疑交易。像考古學家發掘文物,沒有說明書,只能自己觀察推斷。常見任務有:
分群 (Clustering)
將相似的數據自動分到同一「群組」。例如市場分析劃分客戶群,像整理衣櫃,把同類衣服放一起。
降維 (Dimensionality Reduction)
在保留關鍵信息的同時,減少數據的特徵數量。例如製作地圖,用二維呈現三維世界,抓住重點。
關聯規則學習 (Association Rule Learning)
從大量數據中發現不同項目之間的關聯性。例如超市購物籃分析,「買尿布的人也可能買啤酒」,像經驗豐富的店員觀察顧客購物習慣。
半監督學習 (Semi-supervised Learning)
結合監督式和非監督式學習的優點,利用「少量已標記數據」和「大量未標記數據」一起學習。因為標記數據成本高,希望用未標記數據輔助提升模型性能。像學生靠自己學習為主,偶爾老師給予指導。
強化學習 (Reinforcement Learning, RL)
學習方式不同於前兩種,不是從數據中學習,而是讓「代理人」與「環境」互動,根據「獎勵」或「懲罰」信號,學習做出最佳「行動」,以獲得最大長期獎勵。例如訓練機器人走路、AI 下棋、推薦系統優化。像訓練寵物,做對給獎勵,做錯沒獎勵。核心概念:
代理人 (Agent)
學習者和決策者,觀察環境、選擇行動、接收獎勵。像正在學習的實習生。
環境 (Environment)
代理人互動的外部世界或系統,接收行動、改變狀態、提供獎勵。像大型遊樂場或實驗室。
狀態 (State)
環境在特定時間點的完整描述,代理人根據它做決策。像給環境拍的快照。
行動 (Action)
代理人可以執行的操作,會改變環境狀態。像按下遙控器按鈕。
獎勵 (Reward)
環境對代理人行動的反饋信號,好壞的直接體現。像學生的成績單或工作績效評分。
策略 (Policy)
代理人在特定狀態下選擇行動的「行為準則」。像我們過馬路的原則。
遷移學習 (Transfer Learning)
將在一個任務學到的知識應用到另一個相關的新任務,加速學習或提升性能。像學會騎自行車後更容易學騎摩托車。
元學習 (Meta-Learning)
學習「如何更快速、更有效地學習」新任務,從多個任務中歸納通用學習策略。像教學生高效的學習方法。
自監督學習 (Self-Supervised Learning)
從「未標記的數據本身」自動生成「偽標籤」進行學習,利用海量無標註數據。像聰明的學生自己設計練習題並檢驗。
集成學習 (Ensemble Learning)
訓練多個不同的模型,將它們的預測結果組合起來,獲得更好的整體性能。"三個臭皮匠,勝過一個諸葛亮"。
隨機森林 (Random Forest)
基於 Bagging,構建多個隨機的決策樹,投票決定結果。像多位專家組成的決策委員會。
梯度提升樹 (Gradient Boosting)
基於 Boosting,順序構建多棵樹,每棵樹修正前面積累的錯誤。像團隊接力賽跑,不斷改進。
貝葉斯網路 (Bayesian Networks)
用圖表示隨機變量之間的概率依賴關係,進行概率推理。像偵探分析案情畫關係圖。
支持向量機 (Support Vector Machine, SVM)
尋找能「最好地」分隔不同類別數據的「決策邊界」。像在黑白豆子中間畫一條盡量寬的分割線。
K-近鄰算法 (K-Nearest Neighbors, KNN)
根據離未知樣本最近的 K 個鄰居的類別或數值進行預測。"近朱者赤,近墨者黑"。
多任務學習 (Multi-task Learning)
同時學習多個相關任務,利用任務之間的共性相互促進。像學生同時學習物理、數學和化學。
主動學習 (Active Learning)
模型主動選擇它認為最有價值的未標記數據請求人工標註,降低標註成本。像好學生主動找出自己最困惑的知識點去問老師。
增量學習 (Incremental Learning)
模型能從不斷到來的新數據中持續學習和更新,無需重新訓練。像終身學習者不斷學習新知識。
知識蒸餾 (Knowledge Distillation)
將大型複雜的「教師模型」的知識轉移到更小更快的「學生模型」。像資深教授將多年經驗濃縮成入門教材。
課程學習 (Curriculum Learning)
模仿人類學習過程,從簡單樣本開始,逐步增加難度訓練模型。像學校教育由淺入深。
高斯過程 (Gaussian Processes)
基於概率統計,預測輸出值的概率分佈,常用於迴歸和分類,可量化預測不確定性。像地理學家根據少量測量點推測整個區域海拔高度。
決策樹 (Decision Trees)
模擬人類決策過程的樹狀模型,易於理解和解釋。像玩「猜人物」遊戲。
主成分分析 (Principal Component Analysis, PCA)
線性降維技術,找到能最大程度解釋數據變異性的主成分。像將複雜交響樂簡化為幾個主要樂器的演奏。
深度學習 (Deep Learning, DL)
機器學習的一個子領域,使用多層「人工神經網路」從大量數據中自動學習複雜模式。不用人工設計特徵,讓模型自己學習。許多驚豔的 AI 應用都基於深度學習。像廚師通過大量嘗試創造新食譜。
深度神經網路 (Deep Neural Network, DNN)
包含多個「隱藏層」的人工神經網路,能學習到越來越抽象的特徵。像有多道工序的自動化生產線。
感知器 (Perceptron) / 神經元 (Neuron)
神經網路的基本信息處理單元,接收輸入、加權求和、通過「激活函數」產生輸出。像大腦中的神經細胞。
輸入層 (Input Layer)
接收原始、未經處理的數據。像人體的感官系統。
隱藏層 (Hidden Layer)
進行實際計算和特徵提取的核心部分,可以有很多層。像大腦進行思考和推理的中間步驟。
輸出層 (Output Layer)
產生模型最終的預測結果,結構取決於任務類型。像數學題的最終答案。
全連接 (Fully Connected)
一層的每個神經元都與前一層的所有神經元連接。像信息完全流通的辦公室。
激活函數 (Activation Function)
應用在神經元加權輸入後,決定神經元被「激活」的程度,引入非線性。像神經元內部的「調控開關」。
反向傳播 (Backpropagation)
訓練神經網路的核心算法,通過比較預測和真實值計算誤差,反向傳播並更新權重。像老師批改錯題,指出錯誤步驟並指導修改。
損失函數 (Loss Function)
量化模型預測值與真實值之間差距的函數,值越小表示模型性能越好。像給模型打分的「成績單」。
優化 (Optimization)
調整模型參數以最小化損失函數的過程,通過「優化器」實現。像盲人登山者尋找山谷最低點。
梯度下降 (Gradient Descent)
最基礎的優化方法,沿著損失函數梯度的負方向迭代更新參數。像登山者沿最陡峭下坡方向走。
卷積神經網路 (Convolutional Neural Network, CNN)
擅長處理網格狀數據(如圖像),通過「卷積層」學習空間層次結構特徵。像人類觀察畫作,從局部到整體。
循環神經網路 (Recurrent Neural Network, RNN)
專門處理序列數據(如文本、語音),具有「記憶」能力,捕捉序列中前後依賴關係。像閱讀小說時的理解受到前文影響。
模型壓縮 (Model Compression)
減小模型大小和計算複雜度,同時保持性能。便於部署到資源受限設備。像將厚重百科全書製作成袖珍版。
量化 (Quantization)
降低模型參數所需的數值精度。像記錄樂譜時使用簡化符號。
模型剪枝 (Model Pruning)
移除網路中不重要或冗餘的連接或神經元。像園丁修剪樹木。
批次正規化 (Batch Normalization)
在層間對數據進行規範化處理,加速訓練,提高穩定性。像生產線上的質檢和標準化流程。
梯度消失 / 梯度爆炸 (Vanishing / Exploding Gradients)
深層網路訓練時梯度信號逐層傳播可能衰減或放大。像傳話遊戲信息失真。
跳接連結 (Skip Connections)
允許信號或梯度跳過中間層直接傳遞,解決梯度消失問題,可訓練更深網路。像城市交通網絡中的高架橋。
對比學習 (Contrastive Learning)
通過拉近相似樣本、推遠不相似樣本來學習有意義的數據表示,常在自監督學習中使用。像教機器區分雙胞胎和與他人的不同。
聯邦學習 (Federated Learning)
多個參與方在本地用自己的數據協同訓練全局模型,保護數據隱私。像分佈在不同教室的學生共同學習,只匯總學習心得。
MLOps (機器學習維運)
將 DevOps 理念應用於機器學習系統的整個生命週期管理,提高效率和可靠性。像 AI 模型生產的自動化流水線。
模型漂移 / 衰退 (Model Drift)
部署的模型性能隨時間因數據或環境變化而下降。像指南針在強磁場干擾下偏離方向。
過度擬合 (Overfitting)
模型在訓練數據上表現極好,但在新數據上表現很差,泛化能力弱。像學生死記硬背考題答案而不會舉一反三。
人類反饋強化學習 (Reinforcement Learning from Human Feedback, RLHF)
將人類判斷和偏好引入強化學習訓練過程,使模型輸出更符合人類期望。像訓練寵物學習複雜指令時給予細緻反饋。
端到端機器學習 (End-to-End Machine Learning)
單一模型直接從原始輸入學習到最終輸出,無需中間多個獨立處理階段。像訓練自動駕駛賽車手直接從畫面學習操控。
ROC 曲線 (Receiver Operating Characteristic Curve)
可視化評估二元分類模型性能的圖形工具,橫軸假正例率,縱軸真正例率。像評估 COVID-19 篩查測試在不同判斷標準下的準確性。
AUC (Area Under Curve)
ROC 曲線下的面積,衡量分類模型整體判別能力的單一數值指標。像對分類模型整體表現的評分。
推理模型 (Inference Model)
使用已訓練好的模型對新數據進行預測的過程。像語音助手將說話內容轉換為文字。
L114鑑別式 AI 與生成式 AI
零樣本學習 (Zero-shot Learning)
模型能識別訓練時沒見過的類別,通常通過學習輸入特徵與類別描述的關係。像認識「獨角獸」是「長角的白馬」。
Transformer 模型
基於自注意力機制的神經網路架構,擅長處理序列數據,能並行處理並捕捉長距離依賴。許多大型語言模型的核心。像高效會議系統,每個人同時關注所有人發言。
注意力機制 (Attention Mechanism)
模仿人類注意力,讓模型在處理輸入時動態關注最相關部分。像嘈雜環境中專注於與你交談的人。
自注意力 (Self-Attention)
Transformer 使用的注意力機制,序列中每個元素計算並關注同一序列中其他元素對它的影響。像句子中每個詞語環顧四周理解語境。
多模態模型 (Multimodal Model)
能同時理解、處理和/或生成多種不同類型數據(如文字、圖像、音頻)。像擁有多種感官和表達能力的助手。
生成式預訓練 (Generative Pre-training, e.g., GPT)
先用海量無標註數據進行生成式任務預訓練(學習通用知識),再用少量標註數據微調適應特定任務。像學生先廣泛閱讀再專攻特定領域。
生成式 AI (Generative AI, GAI)
專門設計用來創造全新、原創內容(如文字、圖像、音頻)的 AI 系統。核心能力是「生成」而非分析或分類。像充滿創造力的藝術家。
大型語言模型 (Large Language Model, LLM)
在極龐大文本數據上訓練、擁有數十億以上參數的超大規模深度學習模型,展現驚人語言理解和生成能力。許多聊天機器人、智能助手的基石。像博覽群書的超級學者。
擴散模型 (Diffusion Models)
生成模型,通過前向加噪過程和反向去噪學習生成數據。許多頂級文生圖模型的基礎。像藝術家先弄模糊再逐步還原清晰畫作。
穩定擴散 (Stable Diffusion)
流行的開源潛在擴散模型,根據文本生成高質量圖像,推動 AI 圖像生成普及。像樂於分享的厲害畫家,根據你的描述作畫。
DALL-E
OpenAI 開發的文生圖模型系列,以生成富有創意甚至超現實的圖像聞名。像擁有魔法畫筆的插畫師,將你的想像變為現實。
生成對抗網路 (Generative Adversarial Networks, GANs)
由生成器(生成假數據)和判別器(區分真假)兩個相互競爭的網路組成,通過對抗學習生成逼真數據。像偽造大師和鑑定專家之間的較量。
變分自編碼器 (Variational Autoencoders, VAEs)
結合自編碼器和概率圖模型,通過編碼到潛在概率分佈再解碼生成數據。像學會事物「本質」的模型,根據特徵組合重新繪製。
自迴歸模型 (Autoregressive Models, e.g., PixelRNN)
生成序列數據時,當前生成元素依賴於所有先前已生成元素。許多大型語言模型和逐像素圖像生成模型屬於此類。像作家寫小說,下一句依賴於前面的內容。
流動基礎模型 (Flow-based Models)
通過一系列可逆變換學習從簡單分佈到複雜數據分佈的精確映射關係,用於生成和密度估計。像將簡單黏土通過可逆步驟變成複雜雕塑。
幻覺 (Hallucination)
生成式 AI 模型生成看似合理但實際上錯誤、不準確或憑空捏造的內容。像人類做夢時的情景。
上下文窗口 (Context Window)
AI 模型在一次處理或生成任務中能同時考慮的最大輸入文本長度。像 AI 模型的「短期記憶」容量。
微調 (Fine-tuning)
在預訓練好的模型基礎上,使用特定任務的少量標註數據進行進一步訓練,使模型適應特定領域或任務。像通才學者再針對性學習成為專家。
LoRA (Low-Rank Adaptation)
參數高效微調方法,凍結大部分原始模型參數,只訓練少量插入的低秩適配器。像汽車改裝只調整關鍵部位的小模塊。
鑑別式 AI (Discriminative AI)
學習區分或分類不同的數據輸入,學習輸入特徵 X 和標籤 Y 之間的條件概率 P(Y|X),關注找到不同類別的決策邊界。像經驗豐富的審判員或鑑定師,專長是「區分」和「判斷」。
生成式 AI (Generative AI, GAI)
學習數據本身的潛在分佈 P(X) 或聯合概率分佈 P(X, Y),從而「生成」全新的、與訓練數據類似但不完全相同的新數據樣本,側重於「創造」。像藝術家或創作者,根據主題或靈感創造新作品。
多模態生成 (Multimodal Generation)
生成式 AI 系統能生成包含多種不同模態(如文字、圖像、音頻)的組合內容,或在不同模態之間轉換生成。像多才多藝的全能藝術家融合不同藝術形式創作。
條件式生成 (Conditional Generation)
生成式 AI 在生成內容時遵循特定的條件、約束或輸入指令。像廚師根據顧客要求定制烹飪。
掩碼語言建模 (Masked Language Modeling)
預訓練語言模型的技術,隨機遮蓋句子中的詞語,讓模型預測被遮蓋的詞語,學習雙向上下文關係。像語文練習中的「填空題」。
文本生成 (Text Generation)
利用 AI 模型自動創作各種形式的人類可讀自然語言文本內容。像不知疲倦、才思泉湧的作家。
語言模型 (Language Model)
預測文本序列中詞語出現概率分佈的數學模型,通常預測給定上下文的下一個詞。像精通語言規律的學者「猜測」接下來可能出現的文字。
BERT (Bidirectional Encoder Representations from Transformers)
基於 Transformer 的預訓練語言模型,採用雙向訓練方式,能同時考慮左右上下文信息,更深刻理解詞語在不同語境下的含義。像閱讀理解能力超強的讀者前後兼顧理解詞義。
文本到圖像 (Text-to-Image)
利用 AI 技術將用戶輸入的文本描述自動轉換生成為匹配的數字圖像。像給了我們一支「魔法畫筆」將想像變為現實。
長上下文處理 (Long Context Processing)
AI 模型有效處理和理解非常長的輸入文本序列或保持長時間對話記憶的能力。像擁有超強記憶力和專注力的讀者或對話者。
圖像生成 / 合成 (Image Generation / Synthesis)
利用 AI 技術創造全新的數字圖像,可以是憑空想像或基於輸入生成。像賦予計算機「視覺創造力」憑空創造視覺內容。
風格轉換 (Style Transfer)
將一幅圖像的視覺風格應用到另一幅圖像的內容上,生成融合兩者特點的新圖像。像模仿能力超強的魔術師將照片變成名畫風格。
檢索 (Retrieval) 與 記憶 (Memory)
AI 系統從外部知識庫查找相關信息(檢索)並存儲回憶過去交互信息(記憶),結合使用能提供更準確豐富個性化信息。像給 AI 配備「外部大腦」和「個人筆記本」。
L121No-Code 與 Low-Code
No-Code (無代碼)
無需編寫任何程式碼,通過視覺化拖放界面和預製組件創建應用程式(網站、App、自動化流程等)。像玩樂高積木搭建複雜結構。
Low-Code (低代碼)
主要通過視覺化界面和工具開發應用程式,減少手動編碼需求,但允許或要求編寫少量程式碼進行定制。旨在提高專業開發者效率,也讓非專業人士參與開發。像用半自動智能烹飪鍋,大部分自動完成,關鍵步驟可手動調整。
公民開發者 (Citizen Developer)
非專業程序員,利用企業認可的低代碼或無代碼工具創建、修改或定制業務應用程式,以滿足自身部門或團隊需求。像 DIY 愛好者用便捷工具改造家居。
視覺化開發環境 (Visual Development Environment, VDE)
使用圖形化用戶界面而非純文本程式碼來設計、構建和管理應用程式的開發環境,包含拖放界面、流程圖設計器、組件庫等。像用建築藍圖設計房屋,更直觀易懂。
抽象化 (Abstraction)
隱藏系統或組件內部複雜實現細節,只對外暴露簡化的接口。No-Code/Low-Code 平台大量運用,封裝底層技術細節。像汽車儀表盤和操控系統,駕駛員只需了解簡單操作,無需了解引擎細節。
模型驅動開發 (Model-Driven Development, MDD)
以模型(數據模型、流程模型、界面模型)作為開發核心產物,利用工具根據模型自動生成大部分甚至全部應用程式代碼,提高效率和一致性。像從建築設計藍圖通過自動化設備快速生成建築構件。
組件 / 模板 (Components / Templates)
平台提供的預先構建、可重用的功能模塊或元素(組件),以及預先設計好的應用程式框架或頁面佈局(模板),用戶通過拖放組合快速搭建應用。像樂高積木玩具提供的各種標準積木塊和基礎框架。
流程自動化 (Workflow Automation, e.g., Zapier)
利用軟件工具自動執行一系列原本需要人工操作的重複性業務流程或任務,提高效率,減少錯誤。像設置多米諾骨牌,觸發後續動作自動連鎖發生。
Bubble (No-Code 開發平台)
功能強大的無代碼 Web 應用程式開發平台,通過視覺化界面和邏輯編輯器構建複雜 Web 應用,無需編寫任何程式碼。像功能豐富、自由度高的數字世界積木玩具套裝。
Microsoft Power Platform
微軟推出的集成低代碼平台套件,包含 Power Apps(應用開發)、Power Automate(流程自動化)、Power BI(數據分析)、Power Virtual Agents(聊天機器人),可相互集成,快速開發各種業務解決方案。像功能強大的「瑞士軍刀」集成多種業務工具。
L122生成式 AI 應用領域
提示 (Prompt)
提供給 AI 模型(如大型語言模型、文生圖模型)的輸入指令、問題或上下文,引導模型生成特定輸出。像給藝術家布置創作主題。
提示工程 (Prompt Engineering)
設計、構建、優化和迭代提示的技術和藝術,以獲得更準確、相關、符合預期的 AI 輸出。像導演指導演員,找到最有效的方式引導 AI。
零樣本提示 (Zero-shot Prompting)
直接給 AI 模型下達指令或提問,完全不提供任何相關示例,考驗模型基於預訓練知識的能力。像老師直接出從未見過的新題型。
少樣本提示 (Few-shot Prompting)
在提示中先提供幾個相關任務的示例,引導模型理解期望的輸入輸出格式和任務要求。像老師先演算幾道示範題再讓學生練習。
思維鏈提示 (Chain-of-Thought, CoT)
引導模型先展示解決問題的思考過程或推理步驟,然後再給出答案,適用於複雜問題,提高準確率。像要求學生寫清楚數學題的解題過程。
檢索增強生成 (Retrieval-Augmented Generation, RAG)
結合信息檢索系統和生成模型,先檢索外部知識庫相關信息,再將其與用戶查詢一起提供給生成模型生成更準確回答。像作家寫作前查閱大量參考資料。
提示注入攻擊 (Prompt Injection)
通過精心設計的惡意提示欺騙、誤導 AI 模型,使其繞過安全限制、執行非預期操作或洩露敏感信息。像騙子花言巧語騙取信任。
文本到視頻 (Text-to-Video)
利用 AI 技術將文本描述自動轉換生成為動態視頻剪輯。像賦予 AI 成為「微電影導演」的能力。
文本到語音 (Text-to-Speech, TTS)
利用 AI 技術將書面文本文字自動轉換為自然流暢的人類語音。像聘請專業配音演員朗讀稿件。
鏈式思考 (Chain of Thought)
AI 模型在解決複雜問題時逐步進行推理、分解問題、形成中間步驟、最終得出結論的能力或過程。像偵探破解謎案的推理步驟。
Function Call (函式調用)
AI 模型根據用戶請求自主決定是否以及如何調用外部 API 或預定義函式,獲取實時信息或執行具體操作,整合到最終回答中。像給聰明助手配備電話撥打服務熱線獲取信息。
AutoGPT:自主 AI 代理的代表
實驗性開源項目,試圖構建能夠更加自主地完成複雜目標的 AI 代理,將目標分解為子任務,利用自身和外部工具逐步完成。像被賦予極高自主權的「全能虛擬項目經理」。
Canvas (OpenAI 協作功能)
OpenAI 為 ChatGPT 設計的實驗性無限白板協作界面功能,允許用戶在可視化畫布上與 ChatGPT 交互或與他人協同工作,整理思路、生成內容等。像加強版、帶有 AI 助手的 Google Docs 加上思維導圖。
L123生成式 AI 導入評估規劃
決策應用 (Decision Application)
將數據分析、機器學習或 AI 模型的洞察、預測或建議應用於指導和改進決策過程,將信息轉化為行動。像導航給出建議路線,駕駛員實際轉動方向盤。
AI 治理 (AI Governance)
指導和管理 AI 系統設計、開發、部署、監控和使用的政策、標準、規範、流程和實踐框架,確保 AI 應用負責任、合乎道德和法律地運行。像城市交通系統的交通規則和管理機制。
負責任 AI (Responsible AI)
確保 AI 系統的開發、部署和使用以安全、可靠、合乎道德倫理且符合社會價值觀的方式進行的方法論和實踐原則,強調公平性、透明度、可解釋性、可靠性、安全性、隱私保護、問責制等多方面因素。像給 AI 技術裝上「道德指南針」和「社會責任感」。
公平性 (Fairness)
確保 AI 系統在決策或提供服務時,不會對特定個人或群體產生系統性的、不合理的偏袒或歧視。像法律面前人人平等。
可靠性與安全性 (Reliability & Safety)
可靠性指 AI 系統穩定一致地執行功能的程度;安全性指 AI 系統運行過程中不會造成不可接受風險或傷害的能力。像現代飛機的設計理念和安全系統。
隱私與保密性 (Privacy & Security)
尊重和保護個人隱私權,確保個人數據的收集、使用、存儲和共享合乎規範,並有安全措施防止洩露;保密性側重保護數據內容不被非授權方知曉。像堅固的保險箱保護貴重物品。
包容性 (Inclusiveness)
AI 系統的設計、開發和部署要充分考慮不同背景、能力、需求的用戶群體,確保技術惠益被廣泛分享,不排斥任何群體。像公共建築設計考慮無障礙設施。
透明度 (Transparency)
AI 系統內部工作機制、決策過程和輸出結果的可見性、可追溯性和可理解性,有助於建立信任、方便調試和發現錯誤。像把黑盒子換成透明玻璃房子。
責任 (Accountability)
對於 AI 系統的設計、開發、部署和運行及其結果和影響,應有明確、可追溯的責任歸屬機制,在造成損害或違反規則時承擔相應後果。像駕駛員對其駕駛行為負有法律責任。
演算法偏見 (Algorithmic Bias)
AI 系統或算法在做決策時表現出的系統性的、不公平的傾向,可能導致對某些群體產生歧視性結果。像 AI 系統戴上「有色眼鏡」看世界。
可解釋 AI (Explainable AI, XAI)
旨在讓 AI 模型的決策過程和預測結果能夠被人類理解、解釋和信任的技術和方法,打開 AI 的「黑盒子」。像醫生詳細向病人解釋病情和診斷依據。
AI 審計 (AI Auditing)
對 AI 系統進行系統性、獨立的檢查和評估,評估其是否符合法律法規、行業標準、倫理準則和性能要求。像對食品加工廠進行食品安全檢查。
差分隱私 (Differential Privacy)
通過對數據集或查詢結果添加精確計算的隨機噪聲,提供強數學保障的隱私保護框架,防止從公開結果反推出個體信息。像在圖書館借閱記錄中隨機添加虛假記錄。
算法監管 (Algorithmic Regulation)
政府、監管機構或行業組織對 AI 算法和基於算法的決策系統進行監督、管理和規範,確保其應用公平、透明、安全和負責任。像政府對食品藥品市場進行監管。
數位倫理 (Digital Ethics)
倫理學分支,探討數字技術開發、應用和普及過程中出現的各種道德問題、原則和價值觀。像數字社會需要共同遵守的「道德指南針」。
可持續 AI (Sustainable AI)
AI 技術發展和應用不僅追求性能提升,也充分考慮其對社會、經濟和環境的長期影響,力求三者平衡協調發展。像發展可再生能源追求長期環境保護。
綠色 AI (Green AI)
主要關注降低 AI 技術自身的環境影響,特別是能源消耗和碳排放問題,鼓勵開發節能、環保的算法、模型和硬件。像家電領域推廣節能標章。
AI 碳足跡 (AI Carbon Footprint)
一個 AI 系統在其整個生命週期中所直接或間接產生的溫室氣體排放總量。像汽車的油耗或每公里碳排放指標。
社會技術系統 (Socio-technical Systems)
強調技術系統與其所處社會環境之間存在複雜、相互依賴和相互塑造關係的系統觀點,理解技術影響需綜合考慮技術和社會因素的互動。像完整的生態系統中技術與環境和生物相互影響。
算法問責制 (Algorithmic Accountability)
建立機制和原則,要求開發、部署和使用 AI 算法的組織或個人對其算法系統的行為、決策過程及其社會影響負責。像建築師對建築物安全質量負責。
AI 安全對齊 (AI Safety Alignment)
研究如何確保高度智能 AI 系統的目標、動機和行為始終與人類價值觀、意圖和長期福祉保持一致,防止「目標未對齊」問題。像訓練導盲犬理解指令背後的意圖並內化保護主人的核心價值觀。
資料匿名化 (Anonymization)
對個人數據進行處理,移除或修改所有能直接或間接識別個人身份的信息,使數據不再與任何可識別的自然人相關聯。像集體照中用馬賽克遮蓋人臉。
資料假名化 (Pseudonymization)
用假名或代碼替換數據中直接識別個人身份的信息,降低直接識別風險,通常保留一個可還原真實身份的映射表。像作家發表作品使用筆名。
知情同意 (Informed Consent)
數據控制者在收集個人數據前,必須以清晰易懂的方式告知數據主體相關信息並獲得其明確、自由給予的同意。像簽署重要合同前對方詳細解釋條款和風險。
資料最小化 (Data Minimization)
組織收集個人數據時,應僅限於收集與明確告知的處理目的直接相關且為達成目的所必要的最少量數據。像極簡主義生活方式只保留真正必要的物品。
目的限制 (Purpose Limitation)
個人數據的後續處理不得超出最初收集時告知和獲得同意的目的範圍,用於新目的通常需重新獲得同意。像借用工具應按約定用途使用。
歐盟 GDPR
歐盟於 2018 年生效的全面數據保護法律,為歐盟境內個人數據處理活動設定嚴格規則,賦予數據主體強大權利,對違規企業處以高額罰款。像數字世界的「個人數據憲法」。
台灣《個人資料保護法》(PDPA / 個資法)
規範台灣所有機構對個人資料的收集、處理和利用行為,保護個人隱私權益,要求告知並取得同意,保障數據主體權利。像保護個人數據「私人財產」的法律。
去識別化 (De-identification)
泛指所有旨在移除或修改數據中個人身份標識信息,以降低數據與特定個人關聯性的處理過程,匿名化和假名化是具體技術手段。像化妝舞會戴上面具隱藏身份。
加州消費者隱私法 (CCPA)
美國加州的重要隱私法規,賦予加州居民對其個人信息更廣泛的控制權,包括知情權、刪除權和選擇不出售權。像加州消費者在數字世界的「權利法案」。
健康保險可攜性和責任法案 (HIPAA)
美國醫療健康領域聯邦法規,保護個人「受保護健康信息 (PHI)」的隱私和安全,規範醫療機構如何處理包含個人身份的健康信息。像醫患之間具有法律效力的「保密協議」。
AI 導入策略 (AI Adoption Strategy)
組織為成功將 AI 技術整合到業務運營或產品服務中所制定的全面、系統性的規劃和方法,包括願景、目標、成熟度評估、優先領域、資源規劃、實施路徑圖和治理機制。像建造摩天大樓的詳細「建築藍圖」和「施工計劃」。
需求探索 (Needs Discovery)
在引入 AI 之前,深入識別、分析和理解組織內部實際存在的、可通過 AI 技術有效解決的業務問題、痛點或機會的過程。像醫生詳細問診找出病人的真正「病根」。
投資報酬率 (Return on Investment, ROI)
衡量一項投資(如 AI 項目)所能帶來的回報相對於其投入成本的比例,幫助判斷項目經濟可行性。像農夫評估購買種子或農機具的預期額外收成。
AI 導入藍圖 (AI Adoption Roadmap)
將宏觀 AI 導入策略分解為具體、分階段實施步驟的詳細行動計劃,明確目標、任務、時間表、資源、責任人和關鍵績效指標。像長途自駕旅行的詳細「路線圖」和「行程計劃」。
變革管理 (Change Management)
一套結構化的方法、流程和工具,幫助組織及其成員順利從現有工作狀態過渡到新技術(如 AI)帶來的新工作方式。像船長平穩調整航向並通知船員。
AI 倫理框架 (AI Ethics Framework)
組織內部制定的指導 AI 系統設計、開發、部署和使用的原則、準則和最佳實踐,基於負責任 AI 原則並結合組織價值觀和業務特點。像各專業領域的「職業道德準則」。
數據治理 (Data Governance)
組織內部用於管理數據資產的可用性、可用性、完整性、安全性和合規性的一整套政策、標準、流程、角色和控制措施,對 AI 模型的性能和可靠性至關重要。像大型圖書館的管理系統和規章制度。
合規性 (Compliance)
確保組織的 AI 系統及其開發、部署和使用過程符合所有適用的法律、法規、行業標準、內部政策和倫理準則的要求。像駕駛汽車必須遵守交通規則。
風險矩陣 (Risk Matrix)
用於評估、排序和視覺化項目潛在風險的工具,通常是二維表格,橫軸為可能性,縱軸為影響嚴重性,直觀展示需要優先關注的風險。像氣象局發布的颱風警告地圖。
AIGO (AI GO)
台灣經濟部產業發展署推出的協助產業導入 AI 的系統性評估方法和全面指南,幫助組織評估 AI 成熟度、識別應用機會、規劃導入路徑。像經驗豐富的建築師提供的「建築工具箱」和「施工指南」。
SMART 原則
用於設定清晰、可執行的目標的管理工具,SMART 分別代表 Specific(具體的)、Measurable(可測量的)、Achievable(可達成的)、Relevant(相關的)和 Time-bound(有時限的)。像使用 GPS 導航設定具體的目的地和預計到達時間。
POC (Proof of Concept)
小規模、實驗性的項目或試驗,驗證某個想法、技術或解決方案在實際場景中的基本可行性、有效性和潛在價值,重點是快速測試核心假設。像購買新車前的「試駕」。
風險登錄表 (Risk Register)
用於系統性地識別、評估、記錄和跟踪項目所有潛在風險及其相關信息的文檔或數據庫,列出風險描述、可能性、影響、優先級、應對措施、負責人和狀態。像登山隊出發前制定的「風險應對預案清單」。
技術成熟度評估 (Technology Readiness Level, TRL)
評估一項技術從基礎研究到最終在實際系統中成功運行的成熟程度的標準化量表,分為 9 個等級。像描述農作物生長的各個階段。
最小可行產品 (Minimum Viable Product, MVP)
新產品的早期版本,只包含滿足早期核心用戶需求的最基本、最核心的功能集合,快速推向市場收集反饋,指導後續迭代開發。像建造房子先完成基本結構和一個可居住的房間。
A/B 測試 (A/B Testing)
對照實驗方法,比較兩個或多個不同版本的產品、網頁、功能、算法或營銷方案的性能表現,通過分析用戶行為數據判斷哪個版本更好。像廚師研發新菜時做出不同版本請食客品嚐。
關鍵績效指標 (Key Performance Indicator, KPI)
衡量一個組織、項目或系統在達成其關鍵業務目標方面表現如何的可量化指標,對評估 AI 項目的進展和效果至關重要。像汽車儀表板上的各種儀表監控汽車運行狀況。
技術債 (Technical Debt)
在軟件(包括 AI 系統)開發過程中,為了追求短期速度或便利而選擇的權宜、次優方案,未來可能導致更高的維護成本和更差的系統穩定性。像蓋房子時偷工減料導致未來需要花費更多修補。
沒有留言:
張貼留言