dengjf99

dengjf99

课题专家组

课题专家组

软件开发工程师某股份制银行

数智引领，开创未来！

回答

银行人工智能大语言模型大模型时代
回答于 · 2023-07-13

NeMo针对银行对话式场景的训练和推理，能解决哪些问题？

NVIDIA nemo 是由英伟达开发，可用于数据收集、大模型训练、微调、部署。框架具备fine-tuning, prompt learning, and adapter techniques能力，对模型生成内容做优化，学习特定领域知识等；推理上框架使用 NVIDIA Triton优化

赞同4
互联网服务 AI 大语言模型大模型时代
回答于 · 2023-07-13

AI的训练和推理对基础架构带来了什么变革和挑战？

最直接的一个是传统服务器机架的供电、散热效能较低，不满足高性能GPU服务器的要求，空间浪费大。

赞同2
银行人工智能 GPU GPU算力
回答于 · 2023-07-13

老师介绍金融大模型大概需要1000张GPU，若GPU数量只有要求的10%左右，企业还有必要做大模型吗？

100张卡的算力也已经很多了，用于十亿、百亿级别的模型训练完全足够了。

赞同2
互联网服务大语言模型大模型时代
回答于 · 2023-07-13

金融保险的安全属性决定了其不允许使用公有云或连接任何互联网资源来训练大模型，请问如何解决这个问题？

如果是不涉及客户敏感信息的企业私有数据、公开数据，可以考虑使用公有云做模型训练。

赞同4
银行大语言模型大模型时代
回答于 · 2023-07-13

大语言模型应用场景？

知识搜索；提供制度相关的问答，并给出涉及知识出处。智能写作工具：主题内容创作/扩写、不同文体创作营销助手：提供营销文案写作、聊天摘要、问题回答建议坐席助手：话术梳理、通话摘要、话术建议代码助手：代码质检、测试

赞同3
银行 GPU 大语言模型大模型时代
回答于 · 2023-07-13

在大模型计算中GPU如何加速计算？

1）大模型训练可以用英伟达megatron-lm或megatron-deepspeed、Deepspeed。2）在模型推理过程中，使用FasterTransformer框架，也可以使用deepspeed框架进行加速推理。

赞同2
银行大语言模型大模型时代私有化部署
回答于 · 2023-07-08

银行在大模型应用场景方面应该如何抉择是否替换传统模型？

大模型和传统模型一样，对特定任务有特定的评估指标，首先评估指标要有提升，并且结果可控、稳定。另外，大模型的部署推理成本较高，也要考虑ROI。

赞同2
银行 GPU 大语言模型 NVAIE
回答于 · 2023-07-08

对于中小商业银行来说，若要建设大语言模型，预计需要多少资源？需要做哪些前期准备工作？

作为起步资源来说，可以先购置若干台中高配的AI芯片服务器作为训练或推理服务器，英伟达或国产AI芯片的都可以，大概30-100w一台。更简便的方法是使用大厂的云服务，现在逐渐完善大模型的云服务，再使用脱敏后数据做些微调训练，

赞同6
银行数据安全数据加密人工智能
回答于 · 2023-04-26

在ChatGPT大语言模型时代，金融行业如何做好数据安全和隐私保护？

数据隐私与GPU选型没有必然联系，具体保护方式要看模型部署方式、使用的训练语料、用户输入指令的方式等。譬如，最保险的方法是行内私有化部署，只开放给内部用户使用；如果是开放给外部用户使用，则不能使用行内敏感数据和涉

赞同2
证券人工智能 ChatGPT 大语言模型
回答于 · 2023-04-26

中小金融企业能否利用chatGPT进行弯道超车？

大模型的资金和软硬件资源的投入要求是非常高昂的，有的大行是规划了数以亿计的惊人投入，反而可能加剧马太效应。另外，大模型是一个以NLP技术为主的模型，并不一定能解决银行方方面面的业务问题。建议在引入上还是以ROI评估

赞同2

关于 dengjf99

用户名： dengjf99
职位：软件开发工程师
公司：某股份制银行
行业：银行
地点：佛山
社区声望：878.8
荣誉等级：LV.6

关注TA的人

更多关注TA的人 >>

最近来访

关于TWT 使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们
© 2024 talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30

X社区推广