制造論壇-制造行業(yè)自己的交流社區(qū)!

標題: 開源的大模型有哪些? [打印本頁]

作者: 馬蜂科技    時間: 2025-2-21 11:06
標題: 開源的大模型有哪些?
以下是一些常見的開源大模型,按語言模型和視覺模型分類介紹:
開源語言模型
Meta Llama 3
由Meta開發(fā)的語言模型家族,提供多種大小版本,適合從輕量級移動客戶端到大規(guī)模云部署的多種應用場景。
優(yōu)點是可以在相對低功耗的硬件上運行,但其訓練數(shù)據(jù)并未完全公開,因此是否完全符合開源定義存在爭議。
BLOOM
由Hugging Face主導開發(fā)的多語言語言模型,參數(shù)規(guī)模達1760億。
采用“負責任AI許可”,雖然不是完全開源,但可以免費使用和分發(fā),只要不用于許可條款中定義的有害用途。
GPT-2
OpenAI開源的第二代語言模型,基于12億參數(shù)。
適用于多種語言任務,如文本生成和**機器人,采用MIT許可協(xié)議,符合開源原則。
Falcon
由阿布扎比技術創(chuàng)新研究所開發(fā),提供40B和180B兩種版本。
40B版本采用Apache 2.0許可,符合開源定義,而180B版本使用和分發(fā)有一定限制。
Grok.AI
由X.ai開發(fā)的“專家混合”模型,基礎模型更通用。
盡管公開了模型權重和架構,但未公開所有代碼和訓練數(shù)據(jù),因此其開源性存在爭議。
DeepSeek-R1
由DeepSeek AI開發(fā)的開源權重模型,以較低成本提供強大的推理能力。
可通過Hugging Face獲取模型權重,并支持多種部署方式。
開源視覺模型
Stable Diffusion
最流行的開源圖像生成模型之一,支持文本到圖像和圖像到圖像的生成。
能夠生成高度逼真和詳細的圖像,但使用需要一定的技術知識。
YOLO(You Only Look Once)
用于實時目標檢測的快速模型,最新版本為YOLOv11。
適用于視頻監(jiān)控、自動駕駛和增強現(xiàn)實等領域。
DETR(Detection Transformer)
基于Transformer的目標檢測模型,適合需要高精度的場景。
這些開源模型為開發(fā)者提供了廣泛的選擇,可以根據(jù)具體需求選擇合適的模型進行研究和應用開發(fā)。


作者: 夜星晨    時間: 2025-3-27 21:27
完全同意,你的分析讓人信服。
作者: 花花世界    時間: 2025-3-28 05:15
期待更多精彩觀點碰撞!
作者: 閃電兔    時間: 2025-11-30 00:12
完全贊同樓主的看法,這些儀器使用細節(jié)確實容易被忽略~




歡迎光臨 制造論壇-制造行業(yè)自己的交流社區(qū)! (http://jeja-led.cn/) Powered by Discuz! X3.5