国产精品成人久久久久_a级毛片免费高清视频_天天插天天操_91人人_成年人网站国产_国产成人精品一区二区三区

證券日報微信

證券日報微博

您所在的位置: 網站首頁 > 金融機構 > 券商 > 正文

大語言模型在證券行業的應用測評分析

2024-12-13 16:27  來源:證券日報網

    1、引言

    大語言模型(LLM)包含數千億參數,在大規模文本數據上訓練,展現出強大的自然語言理解和復雜任務解決能力。第一個重要里程碑是OpenAI發布的ChatGPT,它優化了對話能力,能夠在多輪對話中準確追蹤上下文,且保持與人類價值觀的一致性。GPT-4在語言模型的基礎上進一步擴展到多模態信號,能夠解決復雜任務,顯著提升評估任務的性能。其他開源大語言模型如Llama-2、Falcon、ChatGLM3等也在迅速發展。LLM在金融領域展現出巨大潛力,逐漸成為處理金融問題的強大工具。金融大語言模型的起始是BloombergGPT,混合專業領域數據集的訓練使其在金融任務上表現優秀,另外,首個針對中文金融領域優化的千億級開源對話大模型是XUANYUAN,在金融場景的測評中,全面超越其他主流開源大模型。

    金融證券領域的LLM應用對數據合規性、準確性、時效性要求高,需要私有化部署并進行個性化訓練,因此存在訓練數據和資源限制。我們嘗試利用小型高質量指令數據集微調LLM,驗證其在金融證券領域工作助手的有效性,構建了SecPile數據集用于微調訓練,包含金融和通用數據集?;诮鹑陬I域常見場景設計評測集,對微調后的模型在通用能力和金融能力方面進行SecScope評測。

    2、證券行業大模型研發進展

    Transformer模型自2017年提出以來,通過注意力機制和自監督學習極大地提升了語言理解和生成能力,成為眾多大語言模型如BERT、RoBERTa、T5等的基礎。目前,技術如LoRA、P-tuning和Prompt-tuning展現了參數高效微調的優勢,包括縮短訓練時間、減少顯存占用,并保持良好的泛化性,使用較少參數進行高效微調以獲得更佳效果是主流趨勢。

    在金融領域,訓練數據集的構成對模型性能有顯著影響。研究表明多任務種類的微調數據,特別是COT數據,能進一步提升微調效果。數據質量被認為比數據集大小更重要,一個小規模高質量數據集可能優于大規模低質量數據集。BloombergGPT和XUANYUAN金融大模型通過不同比例的垂直領域數據和通用數據平衡專業知識與多元應用能力。通過不同的預訓練模型和微調策略發掘金融領域大語言模型的潛力,例如通過混合調優方法緩解災難性遺忘,為金融領域提供更加專業和精準的模型解決方案。

    證券行業正處于推進金融與科技融合的關鍵階段,77家證券公司將數字化轉型作為公司發展的核心戰略,意在實現高質量發展并全面服務實體經濟。大模型技術在行業內的應用逐漸從零售經紀業務擴展到機構業務、資產管理、投資銀行等多個領域。一些頭部券商積極探索大模型技術在智能客服、數字化投行、智能投研、智能協作等細分應用領域的實際應用,中小券商也在積極利用AIGC技術提升自身的內容輸出水平。基于大模型技術的語義理解和內容生成能力,行業內已有多家財富管理機構將其應用于生成符合要求的營銷文案和推廣策略,以提高營銷效果和用戶轉化率。此外,AI數字人等新技術也逐漸在證券行業落地,部分機構正探索將其嵌入到開戶流程、客戶服務等具體業務辦理中,與客戶進行實時互動和溝通。為了支撐上述的技術應用,部分券商正持續提升數據、算力、算法等能力,強化AI中臺技術沉淀和組件復用。但在實際應用中,合規、數據隱私保護等問題仍然需要重視。因此,行業需要進一步深度融合科技與業務,符合法律法規,方能實現科技在金融領域的價值。

    3、SecPile金融與通用數據集

    SecPile數據集包含金融和通用兩個數據集,SecPile金融數據集由司內沉淀的問答數據和金融行業公開知識數據組成,經過預處理和迭代更新機制,保證時效性和準確性。數據集細分為金融從業考試知識點、金融基礎信息、行業知識數據和金融NLP任務數據。金融從業考試知識點包括高質量試題和教材資料,涵蓋證券、基金、期貨等專業科目。金融基礎信息來源于傳統金融數據平臺,包括上市公司、基金、債券等基礎信息。行業知識數據來自證監會、證交所等,涵蓋專業知識、法律法規等。金融NLP任務數據收集自開源社區和比賽網站,包括文本摘要、實體識別、情感分析等任務,經過數據清洗和標準化處理,適用于模型微調和評測。

    SecPile通用數據集由五個高質量的中英文微調數據集組成,覆蓋多輪對話、文本創作、中英翻譯、數據與編程等多領域任務。這些數據已在大型語言模型訓練中展現有效性,經過徹底清洗和預處理,提供豐富多樣性,支持模型在多領域、多場景下的訓練和優化。數據集包括開放式問答與邏輯推理、文本生成與理解、交互式對話與翻譯等類型,來源多樣,通過自動化處理和人工審核確保數據質量。開放式問答與邏輯推理數據旨在提升模型的自然語言理解和邏輯推理能力;文本生成與理解數據集支持模型在復雜文本處理場景下的應用;交互式對話與翻譯數據集增強模型在語言轉換和邏輯編程方面的能力,確保了數據的高質量和實用性。

    4、模型訓練與調優過程

    ChatGLM3-6B-Base是當前三個可選的開源基模型之一,以65.3分的最高綜合得分位列OpenCompass 1.0大語言模型榜單首位。該模型繼承并發展了前代模型的優點,如流暢的對話體驗和低門檻部署要求,同時引入新特性如Prompt格式和函數調用功能,優化多輪對話流暢性和連貫性,并支持復雜場景如代理任務。ChatGLM3通過多樣化訓練數據集、增加訓練步驟和采用合理訓練策略,提升學習效率和性能,在多任務上表現出色。ChatGLMForConditionalGeneration模型架構專為條件生成任務設計,包括詞嵌入層、旋轉位置嵌入技術、由28個GLMBlock組成的編碼器和輸出層,具備改進的長距離依賴處理能力、更高處理效率和準確性,以及更好的穩定性和性能。訓練配置方面,優化了多項參數以提高模型性能,采用混合精度訓練和Deepspeed框架,通過零冗余優化和offload技術減少內存占用,實現更大參數量模型的訓練。

    我們基于BloombergGPT的經驗,將初始學習率設定為6e-5,并使用帶線性預熱和線性衰減的學習率調度器,見圖一。通過不同學習率的控制變量訓練,發現2e-5的學習率在訓練過程中表現出更好的穩定性和平滑性,見圖二。為應對學習率下降過快的問題,我們采用了WarmupCosineLR策略進行更緩慢的學習率衰減,但這一調整并未顯著改善損失曲線的最終值。進一步,我們通過調整weight_decay值從1e-6降低至1e-7,減小了損失函數的波動。綜合考慮損失下降速度、最終損失值和訓練過程的穩定性,我們選擇了學習率為2e-5、調度器為cosine、權重衰減為1e-7的訓練方案,以優化模型的性能和穩定性,最終微調訓練成XCGLM證券垂類大語言模型。

    5、SecScope通用與金融能力評測

    大語言模型在通用能力方面需掌握跨學科知識進行推理,研究通過C-Eval、CMMLU、MMLU和AGIEval四個評測集評估模型的邏輯推理和數學計算能力,并構建專門的意圖識別評測集評估模型對文本意圖的理解能力。在金融領域,模型常應用于摘要生成、關鍵詞提取、實體識別和情感分析等任務,研究設計了SecScope測試集評估XCGLM在證券領域任務的表現,包括金融能力評估、摘要生成、關鍵詞提取、實體識別和情感分析五部分,使用XSum、LCSTS、CSL評測集和新浪新聞標注數據等作為評估基準,對FiQA SA和FPB金融情緒分析數據集進行清洗和校準,構建金融行業專用情感分析測試集。

    圖3評測模型能力雷達圖

    在參數量相近的情況下,大語言模型展現出了類似的性能水平,且隨著參數量的增加,性能有顯著提升。經過針對“遺忘性災難”專門化訓練的模型,如XCGLM和Tongyi-Finance-14B,在通用能力上略遜于原始基礎模型,但在金融領域的知識、從業能力和特定文本分析任務上表現卓越,尤其是在處理復雜特定提示詞的任務時,XCGLM能更全面地遵循指令,產出更高質量的結果,如圖3。這證明了專業化訓練對提升大語言模型在特定領域應用的實際效能的重要性,通過小型高質量數據集微調,能有效打造針對特定行業領域的工作助手,顯著提升從業人員的工作效率,發揮重要作用。

    6、總結與展望

    本文探討了大語言模型在證券領域的應用與優化,通過構建綜合性的SecPile數據集,平衡模型的通用性和金融特性,提供豐富的微調和評測資源。選用ChatGLM3-6B-Base作為基模型,優化其結構和訓練配置,提升模型在金融領域任務集上的表現。微調后的模型有效完成金融實體識別、問答、關鍵詞提取、情感分析等任務,提高金融從業人員工作效率。本文證明利用小型高質量指令數據集微調大語言模型的有效性,為構建特定領域工作助手提供經驗。同時,也凸顯了大語言模型在金融領域的潛力及持續探索優化的重要性。

    未來,大模型的發展更加側重垂直領域應用,或分為行業應用和創新創意兩個賽道,行業應用是對傳統業務的賦能和顛覆,創新創意應用則是利用AIGC邏輯創造出新質生產力。對于證券行業,大模型賦能券商業務是我們接下來深入研究的方向,科技必須和業務場景結合,才能發揮相應的價值和能力。取經于互聯網+經驗,在AIGC+時代下,進一步幫助企業和個人提質增效。對于信息技術部門來說,通過數據、算力、算法能力研發大模型應用開發平臺是首要工作事項。在此平臺上,基于目前大模型成熟的語義理解和內容生成能力,證券行業或可以在營銷軟文創作、智能投顧、群聊智能助手、代碼助手等方向尋求應用落地。隨著大模型的能力逐步提升,大模型Agent與RPA機器人的結合是我們持續探索和落地的方向。

    作者(姓名、單位、職務)

    鄧綱     湘財證券股份有限公司總裁助理、信息技術中心總經理

    李鵬     湘財證券股份有限公司、信息技術中心大數據開發崗

    吳星諭  湘財證券股份有限公司、信息技術中心量化策略與數據分析崗

    王鄭毅  湘財證券股份有限公司、信息技術中心大數據開發崗

    劉文貴  湘財證券股份有限公司、信息技術中心需求分析管理崗

    (CIS)

-證券日報網

版權所有證券日報網

互聯網新聞信息服務許可證 10120180014增值電信業務經營許可證B2-20181903

京公網安備 11010202007567號京ICP備17054264號

證券日報網所載文章、數據僅供參考,使用前務請仔細閱讀法律申明,風險自負。

證券日報社電話:010-83251700網站電話:010-83251800

網站傳真:010-83251801電子郵件:xmtzx@zqrb.net

官方客戶端

安卓

IOS

官方微信

掃一掃,加關注

官方微博

掃一掃,加關注

国产精品成人久久久久_a级毛片免费高清视频_天天插天天操_91人人_成年人网站国产_国产成人精品一区二区三区
      • <li id="qycq8"></li>
      • <rt id="qycq8"></rt>
      • <tfoot id="qycq8"><delect id="qycq8"></delect></tfoot>
      • 成人永久免费| 欧美日韩国产精品一卡| 亚洲深爱激情| 亚洲精品一区二区三区四区五区| 粉嫩高清一区二区三区精品视频 | 神马影院一区二区三区| 久久99精品国产一区二区三区| 国产一区二区三区奇米久涩 | 国产综合欧美| 欧美福利网址| 欧美大片专区| 牛牛国产精品| 欧美精品一线| 国内精品嫩模av私拍在线观看| 日韩一本精品| 亚洲砖区区免费| 亚洲人成77777| 日本一区二区精品| 深田咏美在线x99av| 日韩免费av一区二区三区| 欧美精品一区二区三区在线看午夜| 91视频免费进入| 99影视tv| 老牛影视免费一区二区| 欧美黑人xxxxx| 色综合视频二区偷拍在线| 国产精品久久久一区二区三区| 黄色一区三区| 亚洲精品1区2区| 亚洲一区三区视频在线观看| 国产精品一级| 99久久无色码| 日本精品一区| 午夜精品偷拍| 国产精品亚洲一区| 99精彩视频| 欧美系列一区| 欧美亚韩一区| 5g国产欧美日韩视频| 国产伦精品一区二区三区高清版 | 亚洲高清在线观看一区| 一区二区激情| 国产精品夜夜夜一区二区三区尤| 久久精品日韩| 欧美日一区二区三区在线观看国产免| 激情另类综合| 肥熟一91porny丨九色丨| 人偷久久久久久久偷女厕| 欧美福利视频| 久久蜜桃资源一区二区老牛| 精品视频一区在线| 欧美日本一区二区高清播放视频| 日韩午夜免费视频| 国产精品视频免费一区二区三区| 神马影院午夜我不卡| 亚洲黄色天堂| 久久99久久99精品蜜柚传媒| 欧美日韩国产三区| 97超级在线观看免费高清完整版电视剧| 精品日本一区二区| 亚洲成色最大综合在线| 国产日韩欧美一区二区三区四区| 欧美一区国产一区| 91传媒在线免费观看| 中文字幕一区二区三区乱码| 久久国产一区| 欧美精品成人| 国内一区二区在线视频观看 | 日本成人黄色| 亚洲免费综合| 中文字幕日韩精品久久| 99精品欧美一区二区三区| 欧美精品v日韩精品v国产精品| 久久综合九色综合久99| 欧美精品观看| 欧美lavv| 久久成人一区| 亚洲视频久久| 日韩影院一区| 国产欧美一区二区三区不卡高清| 精品96久久久久久中文字幕无| 精品国产免费人成电影在线观...| 激情综合激情| 亚洲国产一区在线| 国产在线一区二区三区欧美 | 欧美激情偷拍| 欧美久久综合性欧美| 久久一区国产| 亚洲黄色毛片| 欧美日本亚洲韩国国产| 美国av一区二区三区| 91久久国产自产拍夜夜嗨| 一区二区三区在线观看www| 高清视频一区二区三区| 国产欧美日韩在线播放| 一区二区日本伦理| 日韩精品一线二线三线| 久久精品伊人| 国产精品久久国产愉拍| 亚洲国产精品久久久久婷婷老年| 亚洲欧美成人一区| 日本一区二区三区视频在线观看| 国产精品一级久久久| 91九色在线观看| 麻豆久久久9性大片| 国产欧美日韩亚洲| 99精品久久久| 一本不卡影院| 日韩视频一区| 中文亚洲字幕| 99精品久久久| 99国产精品99久久久久久粉嫩| 欧美一区二区三区久久精品茉莉花| 欧美日韩另类综合| 欧美一区2区三区4区公司二百 | 午夜精品剧场| 欧美日韩亚洲一区二区三区四区| 一本一生久久a久久精品综合蜜| 日本在线一区| 亚洲精品视频一区二区三区| 日本亚洲欧洲精品| 亚洲高清资源综合久久精品| 日韩精品大片| 一级二级三级欧美| 欧美日韩一区在线观看视频| 欧美黄免费看| 激情偷拍久久| 香蕉久久夜色| 国产精品福利视频| 麻豆亚洲一区| 中文字幕一区综合| 狠狠干综合网| 国产精品一区视频网站| 91精品国产综合久久久久久丝袜| 国产精品毛片va一区二区三区| 国产精品一区视频网站| 日本在线一区| 国产综合亚洲精品一区二| 国产日韩一区欧美| 2014亚洲精品| 日韩免费中文专区| 黄页网站一区| 成人在线视频电影| 日产国产精品精品a∨| 韩日成人av| 成人区精品一区二区| 精品在线一区| 亚洲无毛电影| 成人在线视频电影| 一本一生久久a久久精品综合蜜| 激情欧美亚洲| 好看的日韩精品视频在线| 亚洲日本一区二区三区在线不卡 | 国产精品毛片| 欧美日韩国产免费一区二区三区| 欧美va天堂| 成人性色av| 黑人一区二区三区四区五区| 久久久久91| 欧美激情一级片一区二区| 久久精品一区二区国产| 亚洲春色在线视频| 久久精品主播| 欧美激情五月| 国产有色视频色综合| 伊人色综合久久天天五月婷| 国内一区二区三区在线视频| 欧美视频在线观看| 久久久99国产精品免费| 99在线观看免费视频精品观看| 久久三级视频| 一区二区三区我不卡| 玖玖在线精品| 影音先锋久久| 天堂资源在线亚洲视频| 久久人人97超碰人人澡爱香蕉| 中文字幕欧美日韩一区二区| 97在线资源站| 黄色精品网站| 视频在线观看成人| 国产不卡一区二区三区在线观看| 国内精品99| 一区二区三区av在线| 国外成人免费视频| 国产一区二区你懂的| 欧美高清视频一区二区三区在线观看| 成人免费视频观看视频| 亚洲国产欧美国产综合一区 | 欧美va天堂在线| 欧美美乳视频网站在线观看| 亚洲欧美精品| 在线国产欧美| 欧美久久视频| 色视频一区二区三区| 国产伦一区二区三区色一情| 亚洲一区二区三区免费观看| 亚洲私人影院| 欧美精品黄色| 欧美在线视屏| 亚洲福利av|