提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
转帖|行业资讯|编辑:陈俊吉|2016-04-29 10:00:26.000|阅读 360 次
概述:正如IBM对Spark大力投入的承诺,IBM目前正将Spark作为核心组件应用到IBM的大数据分析平台中,并在公司内部各种项目中大力的推广Spark。目前,IBM在云端的自助分析旗舰产品Watson Analytics,云端数据加工服务DataWorks都采用了Spark技术。而IBM目前也正使用Spark技术协助NASA下属的非盈利科研机构SETI (致力于研究人类起源和外星文明的科研机构)来搜寻外星文明。
#慧都22周年庆大促·界面/图表报表/文档/IDE/IOT/测试等千款热门软控件火热促销中>>
过去数十年,SETI为了收集外星生命存在的迹象,构建了“艾伦望远镜阵列”(Allen Telescope Array,www.seti.org/ata)。这项工程由微软联合创始人保罗艾伦资助,目标是通过构建一个小型望远镜阵列,在降低成本的同时,达到巨型天文望远镜的探测效果。艾伦望远镜阵列将成为“世界上用于搜寻银河系中其他文明的最有力的工具”-百度百科
艾伦望远镜阵列每小时产生4.5TB的数据流量,而且探测数据中夹杂大量由自然界和人类产生的干扰数据。如何处理如此巨大的数据流量,并通过机器学习算法排除其中的干扰数据,找出真正令人感兴趣的“外太空信号“,是SETI需要解决的技术难题。当SETI找到IBM专家时,IBM的专家们想到了具有海量数据分析、高性能内存计算、深度学习算法的Spark技术,他们使用了IBM Bluemix上的Spark分析服务构建了一套分析应用,帮助SETI解决上述技术难题。
艾伦望远镜阵列产生的数据由两部份组成:
1)结构化数据SignalDB
SignalDB中存储了过去十几年间1.68亿条信号数据的基本描述,例如捕捉信号数据的太空方位,信号频率的多普勒漂移,信号类型(载波还是脉冲)等。每个捕捉数据用一条上述记录进行描述。以下是SignalDB中一条样例记录:
2)非结构化二进制数据CompAmps
捕捉的具体信号数据CompAmps用二进制存放,在进行分析之前,需要通过快速傅立叶变换(FFT)技术,将其转化为可视化的波形。
整套分析架构采用IBM Bluemix上的Apache Spark服务构建,由艾伦望远镜阵列产生的数据被上传到Bluemix上的Object Store存储服务中,然后通过Spark进行分析。
分析应用采用IPython notebooks开发(IPYthon notebook是IBM Spark服务提供的交互式分析工具),分析服务包括
通过IBM Spark服务的IPythonnotebook可视化开发界面,可以将信号数据进行加工绘图,形成可视化的结果(项目中成为瀑布式绘图Waterfall Plot),下面就是对一个信号进行傅立叶变化绘图后的结果:
检测到的信号通常会具有“多普勒漂移”现象,即随着时间变化其频率(强度)会发生变化。想象一下消防车开过时声音由远到近再到远的过程,就是多普勒漂移的例子。现在医院常用的彩超也称多普勒成像,就是利用了这个原理。信号的多普勒漂移通常可能由地球的自转,公转和信号源本身的移动(例如飞机,卫星的移动)产生。
在这个项目中,为了检测来自外太空的异常信号,需要要将来自人类物体(例如飞机、卫星甚至微波炉)或自然界的噪音(例如太阳辐射、地震)过滤掉。而为了判断 不同时间窗口收集到的信号哪些是由同一个信号源(例如飞机、卫星)产生的,则需要首先消除信号中不停变化的多普勒漂移产生的偏移量。由于涉及相当复杂的计 算和海量数据,这也是本项目最大的技术难题。
IBM 团队首先建立了一套复杂的算法,可以根据不同时间、地点计算出地球自转、公转产生的多普勒漂移,然后利用Spark用算法对信号进行多普勒漂移的消减。消减之后的信号就可以比较容易的利用SparkML机器学习算法的聚类(Clustering)和贝叶斯算法进行分类,判断出哪些信号是飞机、卫星、电器、地震等产生的,剩下的哪些无法被归到正常类别的信号,就是需要深入调查的异常信号了。
SETI 项目中集结了来自 IBM Almaden 实验室、IBM Johannesburg 实验室和来自NASA,Penn State大学的世界级数据科学家和天文学家。他们利用IBM Bluemix上的Apache Spark服务,成功的构建了对艾伦望远镜阵列海量数据的计算和分析模型,也验证了IBM Apach Spark服务在海量处理方面的稳定性、扩展性。利用IBM Apache Spark服务的IPython notebook,专家们可以快速的进行交互式分析和数据的可视化。通过项目,IBM也充分展示了通过Spark技术解决复杂问题的实施能力。
好吧,到这肯定有同学会问,哪么项目找到外星人了吗?实际上,项目确实发现了一个位于磁偏角85的信号,而且确定与太阳辐射无关。科学家们正在对信号进行近一步分析,是不是外星人信号还未可知,但是这确实是第一次科学家们从海量数据中排除干扰,发现了可疑的信号。
最后,引用Dr. Seth Shostak,(天文学家, SETI研究中心主管)的话结束本文。
“通过Bluemix上的Spark服务,我们能够和IBM一起构建出令人信服的新方法,通过分析艾伦望远镜阵列的信号数据,来探索外星文明存在的证据。这真是令人激动的合作。”
(“With Spark as a Service on Bluemix, we’ll be able to work with IBMto develop promising new ways to analyze signal data as we hunt for evidence ofintelligence elsewhere in the cosmos. This is an exciting example of synergy inthe service of science.” )
本文转载自
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@hmdbvip.cn



在现代复杂系统开发中,大型项目面临着需求频繁变更、技术复杂性高、团队协作困难、系统可追溯性差等多重挑战。Sparx Systems Enterprise Architect作为一款领先的UML全生命周期建模平台,通过提供统一的建模环境和贯穿从概念到退役的完整工具链,为大型项目提供了至关重要的战略支撑。
HOOPS SDK系列(包括HOOPS Visualize、HOOPS Exchange、HOOPS Communicator等)为开发者提供从图形渲染、3D数据解析到可视化交互的完整工具链,帮助机器人制造商在有限周期内构建出媲美行业顶级标准的专业应用,实现软硬件的最佳融合。
在接到客户投诉的那一刻,工厂最怕的不是质量问题本身,而是查不清来路:同一批次的成品到底是谁做的?用了哪批原料?哪道工序出了问题?
HOOPS Exchange是Tech Soft 3D提供的行业领先CAD数据访问引擎,支持超过30种主流CAD文件格式的导入与导出,完整保留几何结构、装配层级、PMI注释与工程属性
相关产品
工业4.0优选产品 | 商业智能和绩效管理软件领导者,帮助企业成为业绩最佳的分析驱动型企业
SPSS Modeler工业4.0优选产品 | 在历史数据中发现规律以预测未来事件,做出更好的决策,实现更好的成效
Cognos TM1Cognos TM1 是用于分析财务、运营、客户和职员数据的商业绩效管理软件
SPSS Analytic Server从大数据中有效产生预测和建议
Cognos Controller一款财务合并软件,支持完整的结算、合并和报表流程
最新文章 MORE
永利最大(官方)网站相关的文章 MORE
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@hmdbvip.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢
永利最大(官方)网站