双方将在事件驱动型分析这一前沿智能投研及预训练语言模型领域,建立长期和深入的合作伙伴关系。
《科创板日报》2月16日讯(记者 黄心怡)今日(2月16日)下午,财联社、星环科技携手发布“多模态事件驱动量化平台”。双方将在事件驱动型分析这一前沿智能投研及预训练语言模型领域,建立长期和深入的合作伙伴关系。
一方面,财联社借助星环科技在大数据、人工智能和云计算领域的领先技术和产品落地能力,推动数据驱动的业务创新,打造金融信息行业大数据标杆;另一方面,星环科技通过财联社在金融信息舆情方面的数据积累和专家经验,联合打造优秀、可落地的行业解决方案,共同推动智能量化产品的发展。
目前,该事件驱动量化平台发布了多个产品模块,赢得了市场头部量化机构认可。同时该量化数据平台已提供给多家私募、证券行业内头部机构进行实测。
▍多重驱动 助力量化私募强势崛起
截至2022年,国内量化类私募基金管理资产规模已突破万亿元,在证券私募行业的占比超过20%,国内百亿量化私募公司已经突破20家,数量再创历史新高,如何利用好自身优势,切入这万亿规模的市场,是摆在各市场参与者面前的一道难题。
财联社、星环科技联合发布的“多模态事件驱动量化平台”,一方面利用财联社作为金融信息服务机构在新闻驱动策略和事件驱动策略上对业务理解的先天优势;另一方面结合了星环科技在数据技术领域的先进能力,为解决这道市场难题开启了一扇门。
作为兼具高效精准的多模态数据存储、特征提取与分析能力和高可信度的数据信息来源的多模态智能量化产品,该平台通过可信数据源的收集、智能标注、知识抽取、自动标签以及标准化结果输出与分析,形成体系化、聚合化的完整知识图谱与有效量化因子,协助和赋能金融机构的交易员、分析师、研究员或相应部门;并可替代原有重复且冗杂的人工数据、资料收集和主体关系梳理流程,辅助金融机构在行业深度、政策导向、宏观经济等方面,进行全面且深入的智能化专家体系搭建,极大提高理解和研究相应场景的效率。
目前,财联社与星环科技已研发了新闻驱动、政策图谱、公告舆情、风控合规、灾害预警方案等8个产品模块,赢得了市场某头部百亿量化私募的认可。目前量化数据已提供给多家私募、证券行业内头部机构进行实测,产品应用场景持续开发中。未来平台将不断通过将业务与技术的不断融合,走在量化市场的最前沿。
多模智能量化实现路径
相关功能模块包括:
新闻驱动:用舆情分析可以快速收集到股票的相关新闻,再进行文本的情绪分析,并判断出这些新闻的正负面。根据正负面新闻对股价的潜在影响和模型逻辑,以期先于其他人作出投资决策。
政策图谱:汇聚历年来重要政策数据,并通过行业关联到具体的上市公司,帮助投资者快速定位相关政策影响标的。
政策信息化解决方案框架
公告舆情:收集2008年以来所有的公告数据,通过近两百个细分标签,可以追溯上市公司在不同时期发布的特定类型公告对股价的持续影响,对未来的股价走势形成一定的辅助预测功能。
风控合规:通过上百个预设的风险模块,对历史上对上市公司股价影响较大的事件在未来做实时监控,方便投资者第一时间规避潜在投资风险。
灾害预警:通过对地震,海啸,火灾等灾害的烈度以及发生区域的监控,可以第一时间帮投资者分析灾难对上市公司经营的或有影响。
研报数据:通过对研究员历史评价,市场影响力评价的比重不同,测算市场预期与公司实际业绩之间的差距,帮投资者寻找潜在收益空间。
行业数据:通过对不同行业的深度了解,对行业供需、价格等影响因素的整合研究,让投资者对行业有更深刻的认知。
事件驱动因子案例
后续,财联社、星环科技双方将进一步建立更长期和深入的合作伙伴关系,基于新闻大数据的数据挖掘和机器学习技术,共同建设新闻大数据和人工智能平台,推动相关应用创新。同时,双方联合团队将通过建立创新实验室、共创开发者大会、成立行业组织等,在政策知识图谱、新闻事件驱动算法、自动化新闻实体识别等多个方面进行业务和技术创新,形成能成为行业标杆的方案和创新产品。
随着大数据、人工智能、云计算等新一代信息技术的发展,新闻媒体与大数据、AI和机器学习的融合发展,已成为大势所趋。未来,双方将合作开拓数据新市场,发挥各自在内容与技术领域的特长,探索数据市场的新形态、新业务、新应用。
▍预训练语言模型为量化投资提供全新视角
业内分析人士指出,预训练语言模型为基本面量化提供了更为高效的交互式问答工具,一定程度上促进了基本面量化行业研究员生产力的提升,或将为量化投资提供全新视角。
星环科技量化团队判断,面向专业领域发展的企业,可以将自身擅长的厂商结合预训练的语言模型进行优化。企业可在模型后期的SFT(监督微调),RFHL(人类反馈的强化学习)、PPO算法对于预训练模型的定向优化,如金融投研有很多专有知识,需要融合人类研究员或分析师的专业feedback,不断地优化算法结果。
值得一提的是,双方近期也有基于AIGC的相关领域结果发布,包括自动化量化算法编程和生成研究报告。星环科技量化团队认为,虽然是较为初级、不加验证的结论,但是在结合专有领域微调和强化学习融合人类先验知识之后,将把基础投研带到辅助人类投研的一类智能化产品之中。除了研究报告、图文进入统一预训练模型,还有影音频、卫星遥感等多模数据可以进入预训练模型进行优化,有望大幅提升投研效率与准确率,并提升事理推理的广度。
未来,投资机构或相关人员,可以交互式地与此类模型进行高效的投研数据信息挖掘,解决海量的基础投研工作效率问题。融合星环科技多模态数据平台,结合语言大模型预训练调优,将打开智能投研领域AIGC更高维度的应用场景创新,从而更好的服务量化、投研、投顾等一系列专业领域应用建设。
星环科技创始人、CEO孙元浩表示,金融科技结合信息尤其是深度解读,未来在智能量化投研是一个新兴领域,双方在这个细分领域深耕专注服务于量化机构发展。对于下一步,孙元浩明确称:“第一,争取未来实现开放式的平台赋能全行业;其次,基于大模型深度投入研发;第三,结合私募评价体系进行另类量化行业组织构建。”
▍基于新闻业务的独特数据优势
本次发布的事件驱动量化交易平台,拥有一大核心抓手:数据。财联社旗下星矿数据在其中发挥了尤其重要的作用。
星矿数据是财联社金融信息业务的延伸,财联社目前拥有采编团队500多人,报道内容覆盖全国30多个省市、几千家上市公司,且人员仍处于持续增加阶段。专业、强大的记者团队能够触及更多上市公司,并掌握非标信息和事件现场的一手材料,为及时、准确发现最新资讯提供了可能,更为财联社的非标数据资讯业务奠定了基础。
“为了更快地提高采编的效率,信息传播的效率,服务投资者的效率,我们意识到单靠工人已经无法解决问题,于是建立了数据中枢:星矿数据平台。我们不是为了切入数据而切入数据,是真的被投资者的需求逼到了这一步。涉足后我们发现,除已有数据外,金融市场也会产生大量数据,同时数据再次推动金融研究和决策,再根据后者的行为形成数据,就像不断自我进化的生命力一样。而媒体的本质就是发现变化并报道变化。星矿数据平台的诞生,给记者们带来源源不断的选题。财联社在数据业务方面和其他数据机构存在差异化,我们的未来在应用端,星矿数据会变成一个无限扩展化的数据应用工具平台。”财联社总裁徐安安介绍。
星矿数据产出的数据异动,能够及时被记者发现、使用、验证,而记者采访时的关注点,也能及时形成星矿新的数据字段、数据表,这样的产品闭环是单纯数据供应商所不具备的。
星矿数据在赋能服务媒体业务的同时,通过梳理记者的需求,确定了上市公司某些行为对股价的影响是偏向一致的,根据这些事件变动可以快速做出相应的反馈,比如更换审计、管理层大的变动(CEO、CFO变更)、业绩公布、盈利预期等,通过技术转换生成了大量的数据功能表,这些表既可以用于回顾历史,也可以对股价走势形成一定的预测,从而使得传统的传媒数据具备了量化交易的可能性。
在对内系统相对完善和成熟后,财联社将星矿数据平台进一步拓展,针对券商等机构形成产品,将数据传输给券商,为其自营及资管等业务提供帮助。
其中,星矿舆情事件库能够监测证券市场关联信源,从中采集舆情信息,利用其领先的内容运营能力和成熟的NLP(自然语言处理)技术平台,对采集到的原始数据进行实时处理,形成结构化的舆情事件数据,以流式或数据库的方式,在毫秒级时间内向外提供服务。事件库中的舆情事件结构除时间、人物、内容等事件基本信息外,还包含事件热度、可信度等情绪信息,以及与之关联行业、主体及股票等标签信息。投资机构通过星矿舆情事件库,能够对资本市场重要事件做出迅速反应,及时调整其投资决策。
智能投研多模态统一算法框架
关于财联社
财联社由上海报业集团主管主办,通过原创财经资讯和创新金融科技工具,为商业人群、投资机构和上市公司提供新闻、数据等服务。经过多年发展,已经成功跻身国内财经媒体第一梯队,市场规模、传播力、引导力都位居全国媒体前列。目前是国内金融信息服务领域唯一同时拥有互联网新闻信息采编发布资质、金融信息服务资质、高新技术企业资质的媒体机构。
作为上海财经新媒体矩阵的标志性项目之一,财联社已初步形成集“媒体+资讯+数据+服务+交易”五位为一体的业务模式,将力争建设成为与上海国际金融中心地位相匹配的金融信息和数据平台。
财联社将聚焦打造一个科技赋能、多元扩展的新型媒体金融服务平台。在基于采编资质、记者团队、传播影响力为主的内容支撑基础之上,不断夯实以星矿数据库为代表的金融科技大数据平台,在完善全生态链服务的同时,进一步拓展境内外金融产品交易服务平台,让资讯与数据在交易服务中实现更大的价值效应提升,将财联社打造成市场独具特色的新型媒体金融服务平台。
财联社着力构建一个产品赋能、全链条的完整生态商业模式。从资本市场出发,深度链接上市公司、证券公司、银行保险、公募基金、私募基金、个人投资者,形成资本市场参与主体全覆盖;同时,不断拓展资本市场供给侧数量与规模,打造从企业初创到公司上市的全生命周期陪伴式服务生态。
具体而言,在资本市场端,财联社对各类市场资金进行全方位影响,以二级市场金融信息服务为依托,通过证券公司等金融机构深度覆盖下游数以亿计的投资者;通过“睿私募”的“募投管退”全流程服务,对2000+私募机构资金实现深度触达;通过“蜂网”专家服务,间接影响100+公募基金。在企业服务端,从企业初创的成长性挖掘、投融资对接到IPO媒体关系以及上市后IR/PR服务,形成企业全生命周期的陪伴式服务,不断延长资本市场供给侧价值链路。
未来,财联社将不断完善产品服务体系,通过对资本市场现有参与主体及未来供给侧链路的全方位服务,链接资本市场各个主体,深入企业发展各个阶段,形成完善的商业生态闭环,为自身业务拓展创造丰富可能。
关于星环科技
星环科技(股票代码:688031)致力于打造企业级大数据基础软件,围绕数据的集成、存储、治理、建模、分析、挖掘和流通等数据全生命周期提供基础软件与服务,构建明日数据世界。星环科技以上海为总部,以北京、南京、广州、新加坡为区域总部,在郑州、成都、重庆、济南设有支持中心,同时在深圳、西安等地设有办事机构,并在加拿大设有海外分支机构。
经过多年自主研发,星环科技建立了多个产品系列:一站式大数据基础平台TDH、分布式分析型数据库ArgoDB及交易型数据库KunDB、基于容器的智能数据云平台TDC、大数据开发工具TDS、智能分析工具Sophon和超融合大数据一体机TxData Appliance 等,并拥有多项专利技术。目前公司产品已经在十几个行业应用落地,拥有超过一千家终端用户。
2016年公司成为中国首个进入Gartner数据仓库及数据管理解决方案魔力象限的厂商,且被评为最具前瞻性的远见者;2017年被IDC评为中国大数据市场领导者;2018年星环科技成为12年来全球首个完成TPC-DS测试并通过官方审计的数据库厂商;2020年再次被IDC评为中国大数据管理平台领导者。自2021年起,星环科技蝉联Gartner增强分析技术中国推荐供应商;2022年,公司入选Gartner数据中台领域全球推荐供应商;同年6月,入选Gartner中国数据库管理系统产品品类最多的厂商之一。2022年10月,成功登陆上交所科创板。