python [Python] 環境建置與套件管理工具-pip、conda、mamba 前言 相信各位在學習使用python的過程中,會發現有很多安裝環境與套件的方式。隨著套件越裝越多,一定都會遇到環境安裝的問題,套件總是裝了又刪,卻總是弄不好環境,尤其當開始試著建立不同版本的機器學習環境,再加上要使用GPU時,更是常常裝一裝就壞了。面對這樣的問題,以及各式各樣的套件管理工具與安裝方式如pip、
Data Modeling [Data Science] Embedding和向量資料庫系列-2:Embedding實作與相似度計算 前言 上回,在Embedding和向量資料庫系列-1:Embedding是什麼?介紹了Embedding的幾個基本概念,講述了Embedding產生的方式以及其可表達實體的相似與相異關係的特性。這次,本文將利用Sentence-BERT實作範例,帶大家認識如何幫文本產生Embedding,並且利用相似度的計算來完成一些情境的應用。 語言模型 當我們想要幫文本產生Embedding,
Data Modeling [Data Science] Embedding和向量資料庫系列-1:Embedding是什麼? 前言 2022年底,ChatGPT橫空出世,為整個世界帶來又一次的AI熱潮,短短幾個月間,各式各樣的嘗試與應用隨之出現。Open AI 這次投下的震撼彈,也逼著其他科技巨頭們紛紛跟著出牌,一時間整個AI界百花齊放,不只是LLM