分类: 提交时间: 2023-12-13 合作期刊: 《天文学进展》
摘要: 单脉冲搜索作为脉冲星探测的有力工具,在探测旋转射电暂现源以及快速射电暴中扮演着重要角色。为了从海量的射电巡天数据中快速筛选出最有价值的单脉冲搜索候选体,候选体识别已经从早期启发式阈值判断发展到基于机器学习自动识别。对于 FAST 观测,研究了基于机器学习的单脉冲搜索候选体识别应用到 CRAFTS (the commensal radio astronomy FAST survey) 超宽带脉冲星数据的性能表现。在评估过程中,使用单脉冲事件组识别 (SPEGID) 和单脉冲搜索器 (SPS) 两类自动识别方法,通过 7 种不同机器学习分类器对 CRAFTS 基准数据集产生的单脉冲搜索候选体进行自动识别;作为对比,也使用了启发式阈值判断的方法 (RRATtrap和 Clusterrank)。结果表明,SPEGID 具有最好的性能表现 (最高的 F1-score 值 95.1%、次高的召回率 95.4%、最低的假阳性率 4.7%),SPS 具有最快的筛选速度 (平均每小时筛选 4 010 个候选体)。通过对比分析结果,探讨了如何基于 FAST 观测数据开展高效的单脉冲搜索候选体识别。
分类: 天文学 >> 天文学 提交时间: 2023-01-17 合作期刊: 《天文研究与技术》
摘要: 快速射电暴(Fast Radio Burst, FRB)及旋转射电暂现源(Rotating Radio Transient, RRAT)等一些没有明显周期性的天体发现以来,单脉冲搜索受到研究人员广泛关注,同时随着射电望远镜设备日趋完善,更高分辨率和更广阔的观测空间产生的观测数据量剧增,加快对观测数据的处理迫在眉睫。介绍了PRESTO (PulsaR Exploration and Search Toolkit)中单脉冲搜索,使用Cython编程方式对单脉冲搜索中去趋势算法进行优化,并通过Ray框架实现单脉冲搜索在中央处理器(Central Processing Units, CPU)上并行化。实验结果表明,算法优化后的单脉冲搜索并行化,能明显提升搜索程序性能,显著缩短数据处理时间,同时该并行策略仅基于中央处理器,无需修改代码即可在纯中央处理器环境下实现高性能数据处理。
分类: 天文学 >> 天文学 提交时间: 2022-01-14 合作期刊: 《天文研究与技术》
摘要: FAST脉冲星搜索产生的候选体诊断图量级呈指数级增长,给科学数据管理工作带来挑战,迫切需要研究压缩方法实现诊断图的有效存储和加快其在网络中传输共享。脉冲星诊断图像由稀疏的黑白图像、随机分布的灰度图和彩色图像组成,简单视为彩色图像用同一种压缩方法处理显然是不合理的。提出跳白块编码和深度网络压缩编码压缩模型对脉冲星候选体诊断图分区压缩。使用近年来FAST巡天搜索项目脉冲星候选体诊断图来训练和验证。结果表明,改进的WBS压缩稀疏黑白图像的性能是PNG 的5倍;深度网络压缩算法处理灰度图和彩色图PSNR性能优于JPEG和JPEG2000算法,与BPG算法性能相当,SSIM性能远超传统压缩算法。
分类: 天文学 >> 天文学 提交时间: 2020-06-09 合作期刊: 《天文研究与技术》
摘要: 500米口径球面射电望远镜FAST已投入科学运行,漂移扫描巡天采集数据量已超过1PB,预计每年新增至少5PB。现有数据处理软件如PRESTO、SIGPROC等已无法满足PB量级数据的快速处理要求。提出了一种基于PRESTO的分布式并行计算方法,整合利用数据库技术和异地异构计算资源,构建了一套命名Craber的计算加速系统。整体系统由FAST早期科学数据中心与国家天文台团队共同设计和实现。启用Craber子网计算集群D中55个计算节点,应用Parkes多波束巡天数据集和FAST漂移扫描数据验证了系统流程和搜索数据库。单个100MB Parkes巡天数据文件平均耗时36秒,单个128MB FAST巡天数据文件平均耗时22秒。该系统目前已实际参与FAST数据处理并产生数十颗脉冲星发现,有效帮助FAST加速数据处理和扩大新样本数量。