翻页   夜间
智思范文学屋 > 股海弄潮 > 第63章 ChatGPT发布
 
2022年11月30日,星期三,晚上十点。
深圳,陆方家中。
陆方坐在书房里,面前是三块屏幕。左边是星海平台的代码库,中间是当天的交易数据复盘,右边是一个他刚打开的网页——OpenAI的官方博客。他本来只是随手点开,准备扫一眼就关掉。但标题让他停住了——“Introducing ChatGPT”。他读完了第一段,然后第二段,然后第三段。他注册了账号,打开了对话界面,输入了第一行字:“解释一下什么是退市风险预警系统。”
三秒后,屏幕上开始逐字逐句地生成答案。他读了一遍,又读了一遍。不是因为它错了,是因为它太对了。它的回答不仅准确,而且结构清晰、语言流畅。如果不说这是AI写的,他会以为是一个有三年经验的研究员写的。他输入了第二个问题:“写一段Python代码,计算一家公司过去三年营收的复合增长率。”十秒后,代码出现在屏幕上。有函数定义,有参数说明,有异常处理,甚至还有注释。他复制到本地运行了一遍,没有报错。
他靠在椅背上,沉默了很久。然后他输入了第三个问题:“星海平台是一个量化投资系统,如何用大模型增强它的招股书分析能力?”这一次,它没有直接给出答案。它说:“这是一个复杂的问题,需要了解星海平台的具体架构。以下是一些通用建议……”然后它列了五点建议——自然语言处理、关键信息提取、情感分析、风险识别、可比公司对比。每一条,都切中了星海目前的痛点。
陆方盯着屏幕,手指在桌面上轻轻敲着。他想起2016年,自己刚加入默石的时候,星海还只是一个雏形,连财务数据都经常抓错。他们用了六年,才把星海做到现在的水平。但ChatGPT只用了几个月。不是六年,是几个月。
他拿起手机,给周寻发了一条消息:“ChatGPT你试了吗?”
周寻秒回:“试了。正在写代码测试它的金融文本理解能力。”
“结果呢?”
“比星海强。”
陆方放下手机。他需要和陈默谈谈。
2022年12月1日,上午九点。
深圳,默石资本,陈默办公室。
陆方和周寻一起走进来。陆方手里拿着一台笔记本电脑,屏幕上是ChatGPT的对话界面。周寻手里拿着一叠打印出来的测试报告。陈默正在看一份年报,抬起头,摘下眼镜。
“坐。什么事?”
陆方把电脑放在桌上。“陈总,你听说过ChatGPT吗?”
陈默想了想。“昨天看新闻,OpenAI发布了一个对话模型。还没仔细研究。”
陆方调出他和ChatGPT的对话记录。“我昨晚试了一下。它比我预想的聪明得多。我问它退市风险预警系统是什么,它回答得比很多研究员还清楚。我问它怎么写Python代码,它直接生成了一段,跑通没问题。我问它怎么用大模型增强星海,它列了五点建议,每一条都对。”
陈默看着屏幕上的对话记录,一页一页地翻。他的表情从平静变得认真。然后他抬起头,看向周寻。“你怎么看?”
周寻把测试报告放在桌上。“我昨晚跑了十几个测试。让ChatGPT读招股书摘要,然后回答三个问题:这家公司做什么的?有什么风险?值不值得关注?结论是:它的金融文本理解能力,比星海目前的版本强。它能读懂“临床III期”是什么意思,不会像星海那样误判。它能识别“关联方担保”“表外负债”这些风险信号,虽然还不稳定,但方向是对的。”
陈默沉默了几秒。“它比星海强,意味着什么?”
陆方和周寻对视了一眼。陆方先开口。“意味着我们的技术路线可能需要调整。星海是基于传统自然语言处理技术搭建的,用了六年才做到现在的水平。ChatGPT用的是大模型,几个月就超过了我们。如果我们不跟进,星海可能会被淘汰。”
周寻补充道:“不是被淘汰,是被超越。大模型不会让星海失去价值,但会让星海显得不够好。客户不会比较我们用了什么技术,他们只比较结果。如果别人的模型比我们准,他们就会用别人的。”
陈默站起来,走到窗前。窗外,深圳的冬阳斜斜地洒在平安金融中心的玻璃幕墙上,反射出刺眼的光。他沉默了很久。然后他转过身。
“你们建议怎么做?”
陆方说:“引入大模型。把ChatGPT或类似的技术集成到星海平台中。不是替代星海,是增强星海。让它读招股书、读研报、读公告,生成摘要、提取关键信息、识别风险信号。人负责复核和最终判断。人机结合,但机器更聪明了。”
周寻补充道:“技术上有两个挑战。第一,大模型的部署成本很高,需要大量的算力。第二,大模型会产生‘幻觉’——生成一些不存在的数据。在金融领域,这种错误可能是致命的。所以,不能完全信任它。需要人工复核。”
陈默走回办公桌,坐下来。“还有呢?”
陆方想了想。“还有一个。我们需要懂大模型的人。现在的团队,擅长传统自然语言处理,但大模型是另一个领域。要么自己学,要么招人。”
“你打算怎么学?”
陆方犹豫了一下。“我……可能需要一些时间。”
陈默看着他。“需要多久?”
“三个月。至少。”
陈默点头。“那就三个月。你和周寻牵头,成立一个项目组,专门研究大模型在星海中的应用。预算不设上限。需要什么资源,直接找我。”
陆方愣了一下。“陈总,你不担心?”
“担心什么?”
“担心我们走错了方向。大模型很火,但不一定适合金融领域。”
陈默靠在椅背上。“2000年,互联网很火。有人说它不适合金融。后来,所有的交易都搬到了网上。2010年,云计算很火。有人说它不适合金融。后来,所有的数据都存到了云上。今天,大模型很火。有人说它不适合金融。也许他们是对的。但我不想因为害怕走错方向,就不敢走。”
他顿了顿。
“而且,陈曦以后也要用。我们这代人,可以用老方法。她那一代,不会。”
陆方和周寻对视了一眼。周寻说:“那我们从今天开始。”
“好。”
2022年12月,默石资本成立“大模型项目组”,由陆方和周寻牵头,目标是探索将大模型集成到星海平台中。项目组每周开一次会,汇报进展。
第一周,陆方测试了ChatGPT对招股书的理解能力。他输入了苏州晶芯的招股书摘要,问:“这家公司的核心竞争力是什么?”ChatGPT回答:“公司的核心竞争力在于其自主研发的12英寸晶圆先进封装设备,是国内唯一可替代进口的产品。核心专利被同行频繁引用,技术壁垒较高。”陆方把这个回答和星海的分析对比。星海的分析是:“研发强度22%,专利数量42项,行业排名第一。”ChatGPT的分析是人话,星海的分析是数字。
第二周,陆方测试了ChatGPT的风险识别能力。他输入了一份有财务造假嫌疑的公司财报,问:“这家公司有什么风险?”ChatGPT回答:“应收账款周转天数大幅上升,经营活动现金流为负,与净利润严重背离。可能存在虚增收入的风险。”星海的回答是:“应收账款周转天数上升,扣分;现金流为负,扣分。”又是人话和数字的区别。
第三周,陆方遇到了第一个大问题——ChatGPT会产生“幻觉”。他输入了一份某公司的财报,问:“这家公司的研发投入占比是多少?”财报里写的是8%,ChatGPT回答的是12%。他反复测试,发现ChatGPT在数据提取方面不够稳定。当数据在文本中明确出现时,它一般能答对;当数据需要从多个段落中提取时,它容易出错。他在项目组会上说:“这个问题不解决,我们不敢用。”
周寻想了想。“那就限制它的使用范围。只让它做文本摘要和定性分析,不做数据提取。数据提取还是用传统方法。”
陆方点头。“可以试试。”
2023年1月,陆方开始尝试将大模型接入星海平台。技术难度比他预想的要大。大模型的API调用有延迟,每次请求需要几秒钟。而星海需要实时处理大量数据,几秒钟的延迟是不可接受的。他尝试了本地部署,但算力不够。他尝试了模型压缩,但准确率下降。
他在项目组会上说:“这条路走不通。我们需要更大的算力。”
陈默问:“需要多少?”
陆方算了算。“至少需要几百万的硬件投入。而且,技术迭代很快,现在的硬件可能半年后就过时了。”
陈默沉默了几秒。“那就不买硬件。用云服务。按需付费,成本可控。”
陆方点头。“好。”
2023年2月,陆方成功将大模型接入星海平台,但效果不理想。模型的响应速度慢,准确率也不如预期。他反复调试,试了十几种参数组合,都不满意。他开始怀疑自己是不是走错了方向。
周寻拍他的肩膀。“别急。技术迭代需要时间。我们当年做星海,也失败了很多次。”
陆方苦笑。“当年我们有时间。现在,竞争对手可能已经在用了。”
“那也要一步步来。急不来。”
2023年3月,陆方尝试了另一种方案——用大模型生成训练数据,然后用这些数据训练一个轻量级的模型。这样既能利用大模型的理解能力,又能保证推理速度和稳定性。他测试了几天,效果不错。
他在项目组会上说:“这次有戏。”
陈默问:“多久能上线?”
陆方想了想。“三个月。”
“好。”
2023年6月,星海平台完成大模型集成测试。新版本能自动阅读招股书,生成摘要,提取关键信息,识别风险信号。虽然还不能完全替代人工复核,但已经能帮研究员节省50%的时间。
陆方在技术复盘会上说:“星海3.5,终于有点‘智能’的样子了。”
周寻笑了。“不是星海3.5,是星海3.0。之前的版本,只能叫2.0。”
陈默站在技术部门口,看着屏幕上滚动的数据。“陈曦知道了吗?”
陆方愣了一下。“还没。”
“告诉她。她会高兴的。”
2023年7月,暑假。陈曦来公司实习。陆方给她演示了星海3.5的新功能——大模型读招股书。她看得入神。
“陆方叔叔,这是你用ChatGPT做的?”
“对。你爸批准的。”
陈曦笑了。“那我以后也要学这个。”
陆方看着她。“你已经在学了。”
晚上,陈默和沈清如坐在书房里。陈曦已经睡了。
“今天陆方给她演示了星海3.5。”沈清如说。
“嗯。”
“她说,她以后也要学这个。”
陈默笑了。“她会的。”
沈清如看着他。“你希望她回来吗?”
陈默想了想。“希望。但不强求。她想回来就回来,不想回来就不回来。”
“如果她不回来,星海怎么办?”
陈默沉默了几秒。“星海有周寻和陆方。他们还在。”
“他们也会老。”
“那就再招人。一代一代传下去。”
沈清如握住他的手。“你说得对。”
窗外,夜色深沉。远处的平安金融中心,灯光在夜色中闪烁。陈默站起来,走到窗前。
他想起2016年,陆方刚加入默石的时候。那时候,星海还只是一个雏形。现在,星海已经能读招股书了。再过几年,它也许能写研报了。技术会变,但人不会。陆方还是那个喜欢在深夜敲代码的技术极客。周寻还是那个冷静的量化工程师。沈清如还是那个逐字逐句读招股书的研究员。他还是那个站在窗前、看着城市的基金经理。
他转过身,走回书桌前,翻开笔记本,写道:“2022年11月,ChatGPT发布。陆方焦虑,周寻冷静。我们决定引入大模型升级星海。失败了三次,第四次成功了。技术迭代,从来不是一帆风顺。但方向是对的。只要方向对,慢一点也没关系。”
他合上本子,关掉台灯。他走出书房,经过陈曦的房间。门没关严,透出一线光。他轻轻推开门,陈曦已经睡了,手里还握着手机,屏幕上是星海3.5的界面。他把手机从女儿手里轻轻抽出来,放在床头,帮她掖好被角。
“晚安,宝贝。”
他关上门,走回卧室。沈清如已经躺下了。
“睡了?”她问。
“睡了。手里还握着手机,在看星海3.5。”
沈清如笑了。“她比你当年用功。”
陈默躺下来,看着天花板。“清如,你说,星海以后真的能写研报吗?”
沈清如想了想。“能。但需要时间。”
“多久?”
“也许五年,也许十年。但总会实现的。”
陈默侧过身,看着她。“你说得对。”
他关掉台灯。黑暗中,他睁着眼睛,看着天花板。他想起今天陆方说的那句话——“技术迭代,从来不是一帆风顺。”是的。他们失败了三次,第四次才成功。下一次,也许还会失败。但只要方向是对的,慢一点也没关系。
他闭上眼睛。
窗外,夜色深沉。远处的平安金融中心,灯光在夜色中闪烁,像一颗巨大的星星。
明天,太阳还会升起来。市场还会开。星海还会继续进化。技术还会继续迭代。但他知道,有些东西不会变——他们之间的信任,以及想要把最好的东西传给下一代的愿望。
他翻了个身,沉沉睡去。

章节错误,点此报送,报送后维护人员会在两分钟内校正章节内容,请耐心等待。