- A+
本文来自曹政大神的微信公众号【caoz的梦呓】,caoz的文章篇篇犀利,值得细读与收藏,特转载过来,分享给大家,如果你也喜欢,可以微信搜索“caoz的梦呓”来关注他。文章所有版权归原作者曹政所有!
当我沉浸在互联网的时候,往往会盲目的以为自己走在科技的前沿,但实际上,很多领域都在快速进步,对人类未来的深远影响也在逐渐体现,只是游离于我们视野之外,总是被无视,被忽略。
在我参加高考的时候,最好的学生是读生物的,后来很多人自嘲进了一个大坑,因为确实在这个领域想做出成果是很难的。但我们必须承认一个事实,这个世界是由极个别天才引领前进的,尽管绝大部分人在这个领域碌碌无为,但是依然有一些天才,作出了很多让人类瞠目结舌的成就。
作为非生物界人士,今天先说一点最近了解的,关于基因和大数据的话题,感谢某坡国创业者为我做的科普。
0、什么是基因
染色体是DNA的载体,基因是DNA上有遗传效应的片段,构成DNA的基本单位是四种碱基。由于每个人拥有30亿对碱基,破译所有DNA的碱基排列顺序无疑是一项巨型工程。 本段摘自百科
1、基因测序的成本
目前国内有很多做基因测序的机构,米国有著名的23andme,中国有华大基因,也有很多其他的。
基因测序的成本包括两部分,一部分是测序仪,这是一次性的巨大投入,第二部分是试剂和测量的耗材用品,是单次测序的边际成本。目前市场上比较流行的是第二代测序仪,一次可以进行一组基因的测序,测序效率比第一代提升很大,而运营成本则基于能力的提升有了极大的降低。
实际上,为了保证测序效果,试剂成本并没有想象的那么低,单次测序的成本还是需要一些钱的,做一些简单特征的测序,大约在人民币几百元甚至上千元,取决于你的目标,大概要测多少组基因。(全基因的数量是非常恐怖的,目前如果要做全基因测序成本最少几万美金,而且相当高比例基因特征的含义并未被人类破译,所以测出来其实也没啥用。) 而一次性的前期投入也是特别巨大的,一个非常领先的第二代测序仪大概可能需要一个亿人民币甚至更高。所以需要大量的测序才能摊销下来,所以目前基因测序的价格并不低。
根据业内懂行的人描述,23andme那种99美元的测序模式是铁定赔钱在做的,但是主要目的是收集大量的用户基因数据,作为后续的价值所在。
那是不是我前期买一个测序仪慢慢熬年头收回成本呢?其实也不行,因为这玩意,硬件的更新换代和升级,也会有摩尔定律的趋势,估计用不了几年第三代测序仪就出来了,然后你发现你的测序效率和单次测序成本和人家新产品相比毫无竞争优势,甚至按照新的市场价你测序一单赔一单,你不就白瞎了。
所以,如果不是有巨头撑腰和钱多的花不完的金主,没有短期内大量测序顾客的引入,现阶段投资购买测序仪从商业上来说不是一个理智的选择。
2、基因测序能干什么?
我猜很多人都会关心和好奇这个问题。我为什么需要基因测序
第一,可以了解你的先天性疾病,基因缺陷的问题。
比如,乳腺癌的发生几率,先天性心脏病的因素,过敏性问题,以及对某些特定药物的抗药性问题。
这里有两种方法
一种是基于已经破译的基因特征和代码,类似于病毒扫描模式,发现你的某组基因存在某个特征,就说明你属于某个类型的先天性缺陷或者易感人群。
目前新加坡这边创业者跟我讲,关于先天性心脏病已经有90多组基因特征被探明并已经用于医疗临床诊断,最近我们看新闻,经常有一些IT人士或其他成功人士因突发心脏病猝死的案例,其实,通过基因测序这些问题和风险是完全可以预估的。
乳腺癌的风险在基因中的体现也是很明确的被破译了,有些女明星就是因为这个原因提前割掉了一些乳腺。 一些其他癌症易感人群的风险也在被破译中,具体哪些搞清楚了哪些没有我就不知道了。
另一种就是现在流行的大数据了,我只是知道这个基因和什么有关,但并不十分清楚这个基因的特征代表什么,那么我就收集足够多的样本,并尽可能了解他们的与遗传性有关的疾病史,基于大数据给出遗传疾病风险,这就是23andme他们正在干的事情,但这里存在一个问题,就是数据相关不代表真实的科学逻辑相关,特别是数据样本不足够多的情况下。
所以23andme在美国被FDA明令禁止提供医疗建议和医疗辅助服务。但这些数据留存从未来看还是有一定医疗研究价值的。
第二,可以了解你的家族来源,你的血统构成,以及帮你寻找和确认失散的血亲。
实际上我们很难找到纯正血统的汉人,绝大部分中国人都会有极少许来自蒙古,韩国的基因;当然追溯本源我们都来自于非洲。
两个陌生人之间,基因重合的比例是非常低的,因为基因本身的特征分布排列组合实在是个天文数字,所以看基因重合比例能快速分辨血亲关系,比如亲子鉴定,基因重合50%肯定是亲生的,基因重合25%是直系两代血亲,基因重合12.5%是直系三代血亲,以此类推,非直系的可能在这个区间之内,基本上,在五代血亲范围内,这个准确率是非常非常有保证的。
所以,如果防止近亲结婚,什么失散的兄妹啊(小测试,兄妹基因重合应该是多少?) 多年失去联系的的表亲啦,这样就能防止很多狗血乱伦了对不对。
第三,可以做优生筛查
当然,友情提醒,这是违法的!!!
不过我明确知道这事技术成熟,而且已经商用,但在已知的法治国家这基本都是有罪的,我们这里只介绍其技术逻辑。
试管婴儿技术已经成熟,对试管婴儿基于基因做性别筛查,这也已经被很多医疗机构偷偷摸摸做起来了,除了性别筛查,其实还有一项就是风险筛查,淘汰带有一些明确不良基因的受精卵,只保留当前检测条件下健康度最高的受精卵培养,这个事情其实是挺邪恶的,好处是你可以在生育之前遏制住一些先天性缺陷和疾病,缺点是,我们从很多科幻小说中看到过,如果人类自己控制基因来培养未来,很可能未来基因相似性极大增加,多样性极大丧失,从而丧失对一些恶性病毒的抵抗能力。
我想说,人类已经有了这方面的能力,并且有些机构已经开始这样商业化运作,但目前,我们还不能完全解读所有基因编码的含义和风险,换言之,并不存在彻底的筛查和选优的能力(重复一遍,当前全基因测序成本要几万美金,而且大部分并未被破译),甚至可以说,我们所能筛查选优的范围只是人类基因中很小的比例,再明确一点,也许精心筛查选优的那个受精卵,包含了我们所并不明确的严重先天性缺陷基因。这就是现状。
第四,保险业的巨大空间
实际上已经有这样的操作,某些人因为对自己的基因做了测序和缺陷分析,发现未来有很大的几率会有某种疾病,于是在这个领域投入重大的保费,而保险公司对此并不知情。
当基因测序成本再降低一个量级的时候,(按照目前的发展速度,不会很多年),我相信一些医疗健康的保险公司会要求投保人做基因检测,并根据检测结果确定保费,如果你的基因表明你不受很多先天性疾病和缺陷的影响,也许你的保费会变得很便宜,如果你的基因带有很多先天性缺陷,可能保费就会要求比较多。
3、基因方面还有什么进展和黑科技?
转基因植物
这个不解释了,这是目前基因工程最大的商业应用。我们每天都可能吃的到。
基因芯片
基于基因的特性专门研究的处理芯片,据悉可以将对基因的数据分析和解读能力提高上千倍,极大提升了基因破译方面的能力。这项技术有助于基因测序和基因日常研究的普及化,如果全基因测序成本降低到1000美元以内,市场空间就特别巨大了。
基因靶向治疗
基于对癌细胞基因的分析,现在科学家已经可以用基因编辑重组的方式,实现对癌细胞特征的定向攻击。
传统化疗是无差别攻击目标细胞群,虽然能缓解癌细胞生长,但是对健康细胞的伤害和破坏也是巨大的,基因靶向治疗可以仅仅针对癌细胞进行定向攻击,化疗就好比核武器不分良莠的屠杀;而靶向治疗就是精确制导武器。
目前在血液癌和一些恶性血液病上,靶向治疗已经有了非常明显的缓解效果,一些被传统医生认为已经进入晚期只有两个月甚至两周生命的患者可以得到极大缓解并恢复正常工作生活(非治愈,有较高复发风险)。当然,前提是,患者要很有钱才能不断接受这样的治疗。
对其他恶性肿瘤和癌症,目前还没有完全攻破,但是这项技术依然在前进中。
基因破译及彻底人造基因生物
人类基因组项目是一个由所有牛逼国家一起参与的人类基因测序破解项目,目前已经号称全部完成,但后续还是有很多要深入研究的事情,中国也有一些大学和科研机构参与,不过今天这里要额外说一个神人。
Craig Venter,嗯,坦白说,把他的经历和故事讲一讲,如果善于写故事的话,都可以写一篇十万加的牛文,话说,也有不少人写过了。
这里简单说一句,当年全球所有巨头国家,投资三十亿美刀搞人类基因组计划,大家一起努力了八年,只完成了3%的测序,他插进来后,自己搞了个公司,用了3亿美元的投资,找了五个科学家(其中有一个著名的华人科学家,必须提到),两年时间,把剩下97%完成了!然后因为一直申请要求保护他们的专利,官司打到了美国总统那里,这可不是yy小说,最后美国总统,当时还是克林顿,出面调解,说基因测序是全人类的事情,他们才同意开放数据共享给其他科研机构。 然后,由于种种原因,他被自己创建的这家超牛逼公司的董事会开除出局。
这故事没完,被开除后他继续自己单干,做人工基因生物,简单说就是人工对基因进行编辑和组合,创造生物! 最新一期科学杂志(Science,顶级学术期刊)发表他的最新成果,他又创建了一个最少基因组的人工生物体!(咦,为什么说又,哦,几年前他已经搞过一个了)。
当人类可以编辑基因并创造生物的时候(可以自我繁殖),人类已经成了上帝。
当然,他干的这事,有点政治不正确。目前基于道德,伦理,以及各种原因抗议的声浪很高。是上帝还是恶魔,读者自己评判吧。
转基因动物,单性繁殖
基于对基因分裂重组的关键片段的认识和调整,人类已经成功在小白鼠身上实现两只雌性老鼠卵细胞与卵细胞的结合繁殖,颤抖吧,男人们! 只有女性的世界是可以存在的!!
还有一个黑科技,和基因目前关系不大,但也列出来让读者们体会一下。目前科学家已经开始用第三方存储介质存储记忆,当然还是小白鼠实验状态,对小白鼠切除海马体(其实我不懂这个的说),接入第三方的设备进行替换,并观测其反馈,评估是否具有可替代性!!!
想象一下,以后大脑可以扩容了。如果记忆可以移植和扩容,那么意识是什么,能否存储,脱离身体存在?
4、问题与总结
前些日子创业者跟我聊天的时候,说到一个问题。
目前基因测序技术也算比较成熟了,但是在医疗领域的应用并没有被广泛利用起来,其实主要有个原因是。
学医的人不懂生物基因,学基因的人不懂医!
兼顾医学和基因学的专家学者,凤毛麟角,所以很多时候变成各说各话,有些明明已经可行的技术,仍然因此而无法落地应用!
比如,有些难以确诊的心脏疾病,心血管疾病,本来是可以用基因筛查,成熟技术来确诊原因的,但是医生,甚至是非常知名的医生,可能都没有这方面的概念和认识。
此外,即便你贯通了基因和医学,当你需要对更多的基因片段做破译,对更多患者做深入分析的时候,大数据和深度学习能力就凸显了,而这又需要一次跨界! 这还真不是搬概念,如果,我们假设一个背景,如果每个患者都对其关键部分的基因做了测序和数据存档,如果所有相关数据被集中保存,基因测序数据,诊断结果数据,以及各种药物过敏或者其他遗传性疾病数据全部归纳起来,用深度学习的程序去跑这些案例,很可能会对疾病的基因破译上升一个台阶。
其实,alphago后面也盯着这块呢。
5、理想国
也许有一天,每个孩子出生就会把基因数据全部测出来,家长须知中就会告诉父母,你的孩子可能对什么过敏,什么药不能吃,什么东西建议不要碰,什么疫苗不用打,天然免疫;什么疫苗要按照什么计量打(根据基因特征可以看出每个人的抗药性不一样)。如果遇到走失或者被拐卖的孩子,查一下基因分分钟找到父母和近亲。
当我们走入医院就诊的时候,我们的基因数据被快速调出,医生会根据我们的基因报告和病情,酌情开药,不会再问你的药物过敏史,遗传病史。
当我们每个人到一定年龄的时候,政府机构会给我们提醒,某某,您属于什么情况的危险人群,请每年做一个什么检查,并且随身携带某种急救药品。某某,建议您做乳腺切除手术。
当我们去应聘找工作的时候,基因报告会告诉招聘方,此人存在某种先天缺陷,不适合某种类型的工作。
当我们去购买保险的时候,保险公司会调用我们的基因数据开具保单,并明确告诉我们,你有这个这个问题,这个疾病我们是免责的。
甚至当我们去交友网站注册登记寻找另一半的时候,在选择异性各种条件的时候,基因数据都有可能成为做用户搜索和筛选的重要条件。 你的肤色,你的头发颜色,你的眼睛颜色,你有没有腋臭,你会不会海鲜过敏或花生酱过敏,你是不是脾气容易暴躁,都清晰无疑的展示在上面。想想有点可怕了吧。
也许我们要哀叹一句,人类是生而平等的,然而有些基因比其他基因更平等。
最可怕的是,我们想要下一代的时候,甚至不用去找另一半。基因工程帮我们搞定,甚至自体繁殖。
以及,我们不屑的追求下一代的基因完美,从而导致基因多样性降低,出现科幻小说中的现象,一个变异病毒出现,人类全完。。。
技术可以是天使,也可以是恶魔,关键看人怎么用。
广告时间,哒哒哒哒
Qcon架构师大会,我以前参加过2-3次,具体记不清了,很惭愧好像还担任过一次还是两次的分享嘉宾,大概是里面技术水平最low的分享嘉宾了,但因为脸皮够厚,站台的功夫还行,好像整体评价说得过去。
通过Qcon大会认识了很多技术大牛,特别是第一次参加的时候认识了冯爷,从此人生进入了新的境界。此外印象深刻的还有余峰老师,让我知道自己对数据库和性能调优的认识多么的肤浅,简直是井底之蛙。 后来因缘际会给余峰老师做过司机,这事一直让我荣耀至今。
这一届余峰老师又出江湖了,当然其他牛人也是多多,infoq的组织能力杠杠的,我一向讨厌参加各种乱七八糟的营销会和吹水会,但是Qcon架构师大会,我认为还是非常非常推荐,值得学习的活动!
本公众号读者专属优惠码:
QCON-CAOZVIP-PROMO 八折优惠,4月3日之前有效,数量有限,先抢先得!
QCON-CAOZVIP-PROMO 八折优惠,4月3日之前有效,数量有限,先抢先得!
QCON-CAOZVIP-PROMO 八折优惠,4月3日之前有效,数量有限,先抢先得!
嗯,重要内容重复三遍。
点击原文链接,即可参与报名!