
大脑袋需要大数据
全球各种大脑图谱计划正在展开,中国台湾的计划似乎有些小。当地科学家正在研究果蝇,通过单个神经元成像逆向编辑其大脑。他们的工作已经以惊人详细的程度制作了大脑电路的三维图像。
研究人员仅需要一个计算机鼠标和一个网页浏览器就能追踪单个细胞并将其缩放回神经束交织的网络中。这些布线图看起来像挂毯上五颜六色的线,它们可以非常清晰地表明哪些细胞簇控制具体的行为。通过刺激具体的神经线路,研究人员能够提示一只果蝇拍打其左翅或是摇头,这一技能去年11月在美国加州圣迭戈举行的神经科学年会上导致参会者整个下午特别激动。
但台湾新竹清华大学神经学家Ann-Shyn Chiang说,即便是对于这样一个小生物,也耗费了该团队整整十年以每个细胞10亿字节的比率绘制6万个神经元。这甚至不足果蝇属大脑神经细胞的一半。若以此推算,利用同样的方式绘制人脑中的860亿个神经元将要花费1700万年,Chiang在会议上报告说。
其他的技术更加易于处理。2016年7月,一个国际团队发表了人脑褶皱外层——大脑皮层的图谱。很多科学家认为这是到目前为止最详细的人脑连接图。然而,即便在其最高空间分辨率(1立方毫米),每个立体像素(三维物体最小的可分辨元素)均包含数千万个神经元。这与以单细胞绘制果蝇神经元连接图可谓差别悬殊。
所以,在神经生物学的世界里,大数据确实是庞大的数据量。尽管计算机基础设施和数据传输的进步,“大数据”革命数十年前曾席卷基因组学领域,如今神经科学家仍在努力应对他们所在领域的新革命。
有多大
这一部分是因为无论是什么物种,大脑都如此巨大、关联度如此之高。但它也来自于细胞难处理的维度。哺乳动物的神经元主要延伸(即轴突)是其最小分支(树突)长度和宽度的20万倍。如果用意大利面代表树突,那些神经元自身就超过1公里的1/3,或是4个美式足球场。
在实验室中,研究人员通过成百上千个重叠的大脑切片图像堆叠跟踪其数千个投影,从而绘制每个神经元。以光为基础的显微镜能够承载0.25~0.5微米的分辨率,这足以跟踪一个神经元的主体。但想要揭示突触(通过电子或化学信号流的分钟信号衔接点),纳米成像电子显微镜是必需的。更高的像素意味着观测领域更小和更多图片。更多图片意味着更多数据。
“我们不再是应对百万字节,甚至是千兆字节。”洛杉矶南加州大学神经成像实验室负责人Arthur Toga说,“我们应对的是兆兆字节。将它从一个地方挪到另一个地方就是一个问题。”两兆兆字节的数据将填满很多台式机的硬盘。
Chiang的果蝇团队对1兆兆字节的图像进行了梳理,以重建1000个神经细胞——少于果蝇属大脑的1%。HCP明尼波利斯明尼苏达大学共同首席研究员Kamil Ugurbil说,为了绘制人类大脑皮层图像,HCP研究人员分析了来自210名健康青年人的6兆兆字节的核磁共振(MRI)成像数据。实验室可以从该项目的网站或更大的数据集中下载那些数据,每次下载那些8兆兆字节的文件需要花费200美元。
电生理学研究在计算方面也变得更加吃力。今天,研究人员通常每次记录数百个神经元。很快,它将会达到数千个;在5年内,将达到成千上万个,瑞士日内瓦大学神经学家Alexandre Pouget说。“这是我们将要发生的跳跃式前进。”
剑桥哈佛大学神经学家Florian Engert说,如果你记录小鼠大脑神经元活动20分钟,那么将会产生约500拍字节的“闪烁”,其中神经细胞放电代表为像素值的变化。
神经学家没有可以对比的模型,没有将神经连接和活动行为、记忆或认识相关连的地图。考虑到大脑巨大的错综复杂性,马里兰州美国精神健康研究所负责人Greg Farber说,问题“并不在于我们有过多的数据,而是我们远没有达到需要解决这个复杂问题的数据”。
搭建桥梁
过去17年,盐湖城犹他大学研究神经发育紊乱的系统神经学家Julie Korenberg和同事一直研究在恒河猴中绘制大脑边缘系统。这种灵长类动物大脑有60亿个神经元,而人类大脑则有860亿个。但在研究模型中,恒河猴与小鼠或果蝇相比同人类血缘关系最近。
Korenberg的团队正在开发一个三维协调模型,与恒河猴大脑中各种神经成像数据相匹配,这些数据包括从整个大脑MRI连接到单细胞公焦数据以及一些区域的电子显微镜亚细胞分辨率。他们在建立“一个让你在一个图像上选择一个点并以另一种分辨率来看这个点的系统”,国立精神卫生研究所(NIMH)影响社会行为和社会认知项目领头人Janine Simmons说,该机构为Korenberg的研究提供了部分支持。Simmons说,它有些类似谷歌地球,例如,你可以将焦距从40 ×直接转变为1 ×,但却不能得到这些变焦尺度之间的层次。
利用20×共焦透镜绘制恒河猴大脑边缘系统图像将需要巨大的数据集,每个动物远超过600兆兆字节。到目前为止,该团队已经收集了约100兆兆字节的数据信息,可以通过30太字节的本地服务器与云端储存连接的联网储存设备获取。Korenberg说,研究人员可以用缩小尺寸的数据集和一台性能良好的笔记本电脑解决一些问题。但操作大规模的三维共焦数据集需要特别的工作站,即便如此传递每个平铺的图片也很缓慢。
然而,这项尚待发表的研究“有可能成为连接这一领域最重要的进展”。纽约市西奈山医院神经解剖学家Patrick Hof说,他曾与Korenberg合作过。例如,Korenberg说,这些数据可以帮助科学家将在特定神经紊乱(如精神分裂症和自闭症)中看上去很重要的基因联系起来,从而了解确切的大脑线路异常。
文化转变
随着科学家将可能的范围向前推动,他们在建立一个计算通道以应对日益加大的工作量,此外还在建立新的工具共享和可视化最终生成的数据。但缓解神经科学家的数据问题,需要的不只是工具研发,还需要文化转变。很难让人们“放开他们的数据”,加州斯坦福大学心理学家Russell Poldrack说,他用神经成像研究学习和记忆。它可能会成为“一代人的事情”,他说,千禧一代人“比我们这一代人更喜欢共享编码和数据”。Poldrack担心,一流科学家可能会因为科学“与他们认为其应该具有的价值不匹配”而沮丧,并离开这个领域。
但态度在逐渐转变,首先是那些针对软件的,其次是数据。传统上,神经成像实验室会花费大量时间下载和装载同样的β测试软件。“为各种软件失灵和计算瓶颈开路,编写大量累赘的编码以及进行他们自己的数据管理解决方案,以处理同样的问题”。加州大学戴维斯分校神经科学博士生David Grayson说。更糟糕的是,很多非研究性任务被委托给学生、博士后和年轻科学家。
传统的学术模式对此没有帮助。研究人员通常会设置假设,并在其团队内独立地考虑自己的想法。在这样的环境中,研究并未把人带到一起,而是将他们分散开来,华盛顿西雅图艾伦脑科学研究所的Hongkui Zeng说。“你需要让自己不同。需要在该领域建立自己的身份,你需要做一些与他人不同的事情。”
在谈到大脑研究时,“完成”是个移动性的目标。对于神经科学工具包来说也是如此。在神经科学学会年会的讲话中,Chiang感叹绘制一只果蝇大脑的一半图谱居然花费了10年。他们与中国台湾的物理学家合作,正开始利用一种叫作同步加速器X射线断层扫描的技术大幅提高数据认知。“它仅需要不到10分钟就绘制一只果蝇的大脑图像,其中包含数千个高尔基染色单个神经元。”Chiang说,他的团队正在小鼠和猪身上尝试该方法。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
CDA 数据分析师:开启数据职业发展新征程 在数据成为核心生产要素的今天,数据分析师的职业价值愈发凸显。CDA(Certified D ...
2025-07-03从招聘要求看数据分析师的能力素养与职业发展 在数字化浪潮席卷全球的当下,数据已成为企业的核心资产,数据分析师岗位也随 ...
2025-07-03Power BI 中如何控制过滤器选择项目数并在超限时报错 引言 在使用 Power BI 进行数据可视化和分析的过程中,对过滤器的有 ...
2025-07-03把握 CDA 考试时间,开启数据分析职业之路 在数字化转型的时代浪潮下,数据已成为企业决策的核心驱动力。CDA(Certified Da ...
2025-07-02CDA 证书:银行招聘中的 “黄金通行证” 在金融科技飞速发展的当下,银行正加速向数字化、智能化转型,海量数据成为银行精准 ...
2025-07-02探索最优回归方程:数据背后的精准预测密码 在数据分析和统计学的广阔领域中,回归分析是揭示变量之间关系的重要工具,而回 ...
2025-07-02CDA 数据分析师报考条件全解析:开启数据洞察之旅 在当今数字化浪潮席卷全球的时代,数据已成为企业乃至整个社会发展的核心驱 ...
2025-07-01深入解析 SQL 中 CASE 语句条件的执行顺序 在 SQL 编程领域,CASE语句是实现条件逻辑判断、数据转换与分类的重要工 ...
2025-07-01SPSS 中计算三个变量交集的详细指南 在数据分析领域,挖掘变量之间的潜在关系是获取有价值信息的关键步骤。当我们需要探究 ...
2025-07-01CDA 数据分析师:就业前景广阔的新兴职业 在当今数字化时代,数据已成为企业和组织决策的重要依据。数据分析师作为负责收集 ...
2025-06-30探秘卷积层:为何一个卷积层需要两个卷积核 在深度学习的世界里,卷积神经网络(CNN)凭借其强大的特征提取能力 ...
2025-06-30探索 CDA 数据分析师在线课程:开启数据洞察之旅 在数字化浪潮席卷全球的当下,数据已成为企业决策、创新与发展的核心驱 ...
2025-06-303D VLA新范式!CVPR冠军方案BridgeVLA,真机性能提升32% 编辑:LRST 【新智元导读】中科院自动化所提出BridgeVLA模型,通过将 ...
2025-06-30LSTM 为何会产生误差?深入剖析其背后的原因 在深度学习领域,LSTM(Long Short-Term Memory)网络凭借其独特的记忆单元设 ...
2025-06-27LLM进入拖拽时代!只靠Prompt几秒定制大模型,效率飙升12000倍 【新智元导读】最近,来自NUS、UT Austin等机构的研究人员创新 ...
2025-06-27探秘 z-score:数据分析中的标准化利器 在数据的海洋中,面对形态各异、尺度不同的数据,如何找到一个通用的标准来衡量数据 ...
2025-06-26Excel 中为不同柱形设置独立背景(按数据分区)的方法详解 在数据分析与可视化呈现过程中,Excel 柱形图是展示数据的常用工 ...
2025-06-26CDA 数据分析师会被 AI 取代吗? 在当今数字化时代,数据的重要性日益凸显,数据分析师成为了众多企业不可或缺的角色 ...
2025-06-26CDA 数据分析师证书考取全攻略 在数字化浪潮汹涌的当下,数据已成为企业乃至整个社会发展的核心驱动力。数据分析师作 ...
2025-06-25人工智能在数据分析的应用场景 在数字化浪潮席卷全球的当下,数据以前所未有的速度增长,传统的数据分析方法逐渐难以满足海 ...
2025-06-25