实时搜索专家Krzana正式进军金融大数据市场

未央网 作者: Ian Allison 译者: Array

通过与以能源为重点的对冲基金和股市观察家签署联盟协议,来自伦敦的实时搜索专家Krzana正在金融数据市场掀起一场巨浪。

对冲基金对数据有着迫切的需求,因为他们希望对相关信号作出迅速实时的交易反应。而Krzana的出现满足了他们的需求,通过一个简单易用的仪表板,Krzana用户就可以轻松实现对新闻、社交媒体、RSS、博客和图片信息的过滤和筛选。

该平台现在每天可以处理近5亿条推文。通过这个高效的过滤器系统(如强大到足以处理实时数据流),用户可以自行决定相关数据,在数据筛选方面成功实现“少而精”。

平台许可证的售价为每个用户每月200英镑,如此具有破坏性的价格同样对Krzana近来的成功起到了不小的推动作用。

前不久,美国路易斯安那州的一家炼油厂发生火灾,而一家能源对冲基金用户正是通过Krzana得到了这个实时消息并作出了及时的交易反应。据说消息来源是巴吞鲁日当地的一家报纸,对这件事故的报道也早于彭报社、路透社和道琼斯等多家知名媒体。

在现实的交易中,就是在这关键的十分钟左右,这家对冲基金取得了可观的利润。成品油的利润率,被称为柴油裂纹价差,扩大了7%。与此同时,市场预计路易斯安那对于原油的需求将走低,也就是减少了对于需要炼油的石油需求,使得当地墨西哥湾沿岸地区的原油的基准价格下跌25至35美分。

Krzana首席执行官Sandip Sarda表示:“Krzana会在第一时间选出了这样的重要文章,比任何的专业机构都要反应迅速。我们的引擎包括多个数据源,它们会流入我们的自定义过滤器,我们称之为本体,然后在显示之前经过进行一定的数据处理。例如,我们有一个专注能源领域的“Krzana能源终端”,流经于此的数据将涉及地震、地震数据、天气事件、管道、传输以及任何与能源相关的结构、企业和部门等等。新闻总是出现在某个地方,能够在主流新闻报道之前得到这样的信息,这才是优势所在。”

Krzana首席营销官Geoffrey Todd指出,现在平台提供的两个核心模块分别是股权和能源板块。Krzana之前着重对系统进行能源领域的训练,但现在的关注重点变成了金融市场。虽然其他的领域Krzana也会涉及,因为从媒体角度来看,这些领域同样也存在很多的危险环境和安全警示信号。

Krzana技术团队的出现改变了以往细节化宽泛化的市场数据模式,通过机器学习人工智能将一些全方位的大数据分类成针对于特殊行业的数据信息。

此外,Krzana还通过一种”故事聚集“模式去除社交媒体产生的噪音,以及用户的假阳性反应。对此,Sarda解释道:“比如有一条推文出现了,随着而来的有另外的100条类似的推文,它会显示为一个集群,而不是每个类似的文章散步在平台的各个角落。“

Krzana数据过滤器的配置过程大约需要5分钟,然后相关云平台就可以完成搭建并开始运行。这是一种廉价的”傻瓜”式的运行模式。Todd说,随着用户数量越来越多,Todd注意到有越来越多的人开始关闭来自推特的信息源,以比较和对比数据的输出。

Todd说:”不要误会我。我们很欣赏Twitter原始数据的效率。但是你可以设置两个几乎相同的搜索频道可以搜索到你要找的数据和信息,比如一个数据源是来自于推特,而另一个则不是。”

“那么这个平台也有排除某些条款的能力。如果有人交易黄金,但在奥运会期间我们会排除”里约”这个词。因为当我们看到结果的时候,我们不希望看到含有“里约”这个字眼的有关黄金的信息。我们可以将某个术语从推特流中提炼出来,然后单独搜索它。我们发现推特也是一个挑选图片的好地方。这体现了重要的搜索工具的灵活性。”

“除了在外部数据的基础上过滤数据之外,Krzana还可以与一些大系统合作,从事大规模的业务流程再造项目。有社会的数据源。

Todd表示:“组织和订购多个大数据和实时源对于现在的公司和平台来说是一个难度不断增长的挑战,而如今这种嵌入式整合的趋势也愈加明显。”

通过与以能源为重点的对冲基金和股市观察家签署联盟协议,来自伦敦的实时搜索专家Krzana正在金融数据市场掀起一场巨浪。

对冲基金对数据有着迫切的需求,因为他们希望对相关信号作出迅速实时的交易反应。而Krzana的出现满足了他们的需求,通过一个简单易用的仪表板,Krzana用户就可以轻松实现对新闻、社交媒体、RSS、博客和图片信息的过滤和筛选。

该平台现在每天可以处理近5亿条推文。通过这个高效的过滤器系统(如强大到足以处理实时数据流),用户可以自行决定相关数据,在数据筛选方面成功实现“少而精”。

平台许可证的售价为每个用户每月200英镑,如此具有破坏性的价格同样对Krzana近来的成功起到了不小的推动作用。

前不久,美国路易斯安那州的一家炼油厂发生火灾,而一家能源对冲基金用户正是通过Krzana得到了这个实时消息并作出了及时的交易反应。据说消息来源是巴吞鲁日当地的一家报纸,对这件事故的报道也早于彭报社、路透社和道琼斯等多家知名媒体。

在现实的交易中,就是在这关键的十分钟左右,这家对冲基金取得了可观的利润。成品油的利润率,被称为柴油裂纹价差,扩大了7%。与此同时,市场预计路易斯安那对于原油的需求将走低,也就是减少了对于需要炼油的石油需求,使得当地墨西哥湾沿岸地区的原油的基准价格下跌25至35美分。

Krzana首席执行官Sandip Sarda表示:“Krzana会在第一时间选出了这样的重要文章,比任何的专业机构都要反应迅速。我们的引擎包括多个数据源,它们会流入我们的自定义过滤器,我们称之为本体,然后在显示之前经过进行一定的数据处理。例如,我们有一个专注能源领域的“Krzana能源终端”,流经于此的数据将涉及地震、地震数据、天气事件、管道、传输以及任何与能源相关的结构、企业和部门等等。新闻总是出现在某个地方,能够在主流新闻报道之前得到这样的信息,这才是优势所在。”

Krzana首席营销官Geoffrey Todd指出,现在平台提供的两个核心模块分别是股权和能源板块。Krzana之前着重对系统进行能源领域的训练,但现在的关注重点变成了金融市场。虽然其他的领域Krzana也会涉及,因为从媒体角度来看,这些领域同样也存在很多的危险环境和安全警示信号。

Krzana技术团队的出现改变了以往细节化宽泛化的市场数据模式,通过机器学习人工智能将一些全方位的大数据分类成针对于特殊行业的数据信息。

此外,Krzana还通过一种”故事聚集“模式去除社交媒体产生的噪音,以及用户的假阳性反应。对此,Sarda解释道:“比如有一条推文出现了,随着而来的有另外的100条类似的推文,它会显示为一个集群,而不是每个类似的文章散步在平台的各个角落。“

Krzana数据过滤器的配置过程大约需要5分钟,然后相关云平台就可以完成搭建并开始运行。这是一种廉价的”傻瓜”式的运行模式。Todd说,随着用户数量越来越多,Todd注意到有越来越多的人开始关闭来自推特的信息源,以比较和对比数据的输出。

Todd说:”不要误会我。我们很欣赏Twitter原始数据的效率。但是你可以设置两个几乎相同的搜索频道可以搜索到你要找的数据和信息,比如一个数据源是来自于推特,而另一个则不是。”

“那么这个平台也有排除某些条款的能力。如果有人交易黄金,但在奥运会期间我们会排除”里约”这个词。因为当我们看到结果的时候,我们不希望看到含有“里约”这个字眼的有关黄金的信息。我们可以将某个术语从推特流中提炼出来,然后单独搜索它。我们发现推特也是一个挑选图片的好地方。这体现了重要的搜索工具的灵活性。”

“除了在外部数据的基础上过滤数据之外,Krzana还可以与一些大系统合作,从事大规模的业务流程再造项目。有社会的数据源。

Todd表示:“组织和订购多个大数据和实时源对于现在的公司和平台来说是一个难度不断增长的挑战,而如今这种嵌入式整合的趋势也愈加明显。”