即可将网页分享至朋友圈
用7条采样线就可以重建256×256 Shepp-Logan phantom图像?这就像冰川学家用7根冰芯来推断整座冰川的整体状况那样困难。然而,要做到这一点并非天方夜谭。近日,我校数学图像研究团队的博士生马天咴针对稀疏优化领域的前沿问题之一,构建了一个神奇的数学模型,创造了稀疏优化领域的新佳绩。
实验表明,这是目前学界所需采样线最少的图像重建方法之一,在稀疏向量重建、矩阵修补以及核磁共振图像重建中取得了比目前最先进的对照方法更好的效果。相关论文成果已经发表在了图像处理与应用数学顶级杂志、美国工业与应用数学学会会刊《SIAM Journal on Imaging Sciences》,马天咴是第一作者。
“试想一下,如果可以通过少量观测数据来重建图像,那么,病人要做核磁共振成像,就不用一动不动地躺一两个小时了!”马天咴说,这种方法在医学成像领域具有广阔的应用前景,不仅可以大幅缩减成像时间,也可以使治疗费用大幅下降。
不仅如此,它还可应用在信号与图像处理、压缩感知、机器学习、计算机视觉、人工智能、数据挖掘等更广阔的领域。尤其是,利用稀疏结构还可以极大地加快大规模优化问题的计算速度。
“压缩感知”炙手可热
压缩感知技术是一种从低分辨率样本中重建高精度数据的数学工具。它的发现者伊曼纽尔·坎迪斯曾形象地比喻说:“这就好像你给了我十位银行账号的前三位,然后我能够猜出接下来的七位数字。”
与经典数据压缩的“采集-压缩-传输-解压缩”的模式不同,“压缩感知”的理念是:既然采集的数据反正要压缩掉其中的冗余度,不如直接“采集”压缩后的数据,然后从少量的测量数据中有效地还原出原始的、完整的数据。
自2004年以来,在天才般的澳大利亚华裔数学家陶哲轩以及伊曼纽尔·坎迪斯、贾斯廷·龙伯格等学者专家的努力下,学术界这一方面的研究取得了很大进展,并逐渐风靡起来。他们发现,如果假定信号满足某种特定的“稀疏性”,那么从少量的测量数据中确实有可能还原出原始的、完整的数据。此后,这一方法迅速扩展覆盖了“由于客观条件所限不得不采集不完整数据”的几乎所有情境,有着极大理论和应用前景。
2007年,我校黄廷祝教授敏锐地意识到,“压缩感知”是一个十分有潜力的研究领域。于是,他在数学学院倡导组建了“图像处理建模与高性能算法(数学图像)研究团队”。正是在这一年,马天咴考入了数学学院。
百尺竿头更进一步
马天咴本、硕、博都在数学学院就读,至今已在成电这片热土上生活学习了10年之久。读研期间,他在图像处理建模与高性能算法(数学图像)研究团队耳濡目染,对“压缩感知”领域有了一定了解。从2013年起,他在黄廷祝教授的指导下读博,并开始深入研究压缩感知领域的稀疏优化等前沿问题。
2016年初,马天咴到美国德州大学达拉斯分校留学,进一步研究“重建稀疏向量和低秩矩阵”问题。此时,他的美国导师Yifei Lou教授正在带领团队以核磁共振图像为例研究这一问题,并且已经在“稀疏度量函数”等方面取得了成果。马天咴加入团队之后,沿着前人开辟的道路继续前行。
经过短暂的迷茫和适应之后,2016年4月,他开始有了新的发现和灵感。他觉得,美国导师的团队已经做出的工作还存在一定的局限性,如果能在此基础上做一些优化,已有的研究工作可能会有更好的效果。
为了看看自己的初步想法是否行得通,他先进行了一些理论推导,发现效果还可以,于是更加坚定信心继续深入研究。2016年5月,他开始动笔写论文草稿,完成了最初的理论雏形。
“每一个有趣的信号都是稀疏的,只要你能够正确定义它的稀疏性。”他说,“向量的稀疏性和矩阵的低秩性是一脉相承的,是一种性质的不同表现。如何利用这种性质?关键就是,要在数学上去很好地刻画这种性质,这就需要一种函数去度量。”
在黄廷祝教授和Yifei Lou教授的共同指导下,马天咴提出了基于截断l1-2伪范数的新型稀疏度量函数,并对其理论性质、数值求解与实际应用进行了深入的研究。在理论方面,他建立了受限正交性质框架下截断l1-2最小化的稀疏重建定理;在数值方面,基于凸函数差算法提出了高效求解截断l1-2最小化的数值策略。
补充关键实验案例
论文写得差不多了,马天咴开始系统地做实验验证。2016年10月初,他完成了初稿,并怀着忐忑的心情投稿给了图像处理与应用数学顶级杂志、美国工业与应用数学学会会刊《SIAM Journal on Imaging Sciences》。这是他第一次向如此高级别的期刊投稿,内心十分忐忑。
不料,几天以后,他的论文就被拒稿了。主编在回复中充分肯定了他的研究,但仍然觉得既然该期刊是图像处理与应用数学领域的期刊,研究的内容就一定要和图像处理紧密相关。马天咴说:“当时我的实验做得还比较少,更多地在理论层面重建稀疏向量与低秩矩阵,只随机生成了一些算例,和图像处理没有太多关系。”
被当头泼了冷水的马天咴面临两个选择:一是改投更偏重计算的期刊;二是按照编辑的建议,再加一些实验案例。如果选择前者,基本不用修改就可以直接投稿。但他经过思考,决定选择后者,迎难而上,赶紧补充实验。
图:马天咴的实验结果表明,他提出的方法(右一)仅通过7条采样线成功重建了256×256 Shepp-Logan phantom图像,这是已知方法所需采样线数目的最低值。
在这次修改中,他尝试用自己的方法,重建了Shepp-Logan phantom图像。这是医学图像处理领域用来进行仿真测试的标准模拟图像,由一些大大小小的椭圆来模拟生物器官。12年前,“压缩感知”的发现者伊曼纽尔·坎迪斯正是用这张图片测试了名为“L1-范数极小化”算法。
一般来说,重建同样规模的数据所用的观测数据越少,就越能说明重建的效率更高。马天咴测试的结果是:他只需要用7条采样线就能成功重建256×256 Shepp-Logan phantom图像。这是已知方法所需采样线数目的最低值,比陶哲轩、坎迪斯、隆伯格等先行者的方法更好。
期待继续攀登高峰
半个月之后,他在论文中加入了核磁共振实验,再次投稿,结果顺利送审、发表。这篇论文的题目是《“Truncated $l_{1-2}$ Models for Sparse Recovery and Rank Minimization”》。这是迄今为止马天咴撰写的论文所发表的最高级别的期刊。
然而,他并没有因此而有丝毫的自满。他坦承,自己所用的核磁共振图像,只是从实际问题中高度抽象出来的一个理想化的标准图像,距离真正应用于医学图像处理还有相当的距离。不过,他对这种方法的应用前景充满信心。
展望未来,马天咴已经做好准备迎接科学道路上的更大挑战。他说,没有人能随随便便成功。在追求科学的道路上,一定会有不计其数的困难和挫折。而且,越是想做出更好的工作,就越有可能经受更大的挫折。“我的科研经历就是在遇到困难、解决困难的过程中走过来的。”
他很感谢黄廷祝教授在学术方面对自己的指导。他说,“黄老师教导我们一定要做到‘四勤’,也就是眼勤、手勤、嘴勤、耳勤。眼勤,就是要多看文章;手勤,就是要多实践,因为应用数学很注重实验;嘴勤,就是多讨论,多和团队成员以及同领域的学者交流讨论;耳勤,就是要多听,多去参加学术会议,去听别人的见解。
“做到这‘四勤’,经过一段时间的积累,就一定能够产生自己的想法,从学术上完成从0到1的突破。”马天咴说,“这些历练,可以帮助我们在未来的道路上走得更好!”
编辑:林坤 / 审核:罗莎 / 发布:陈伟