Home Comments Thread
New Thread

5 Comments

giscus-bot giscus-bot 2022-12-16 20:18:06
访客 *cloud_wei* @ 2011-02-28 14:21:44 写道:

我也觉得模型那一章太大不好写,不过可以将其中一些最为经典的图形拉出来放到别的章节里面~

@taiyun

yihui yihui 2022-12-16 20:18:10

正是这样处理的,都扔到数据一章中了。

——原帖发布于 2011-03-02 13:19:22

giscus-bot giscus-bot 2022-12-16 20:18:07
访客 *bestwood* @ 2011-02-28 16:40:11 写道:

你可以看看最新的Cell,Nature,Science上的组学类型paper,应该有很多数据符合你的要求,而且这些数据基本都在paper附件的excel中,很容易下载到。
不过有一个问题是这些数据往往是专业仪器产生的,比如芯片测量出来的基因表达量。不如R自带数据里面长度,个数,人数这类的简单易懂。

yihui yihui 2022-12-16 20:18:11

谢谢。我自个儿去找恐怕有困难,如果你有读过相对易懂的文章,不妨给我发两个链接看看。芯片数据到了统计学家手中大多已经变成整齐可用的矩阵了,行为基因,列为样本,我是外行,外行可能也有外行的好处,想象得简单一些:)

——原帖发布于 2011-03-02 13:22:22

giscus-bot giscus-bot 2022-12-16 20:18:07
访客 *zwdbordeaux* @ 2011-03-01 02:12:10 写道:

http://www.biomedcentral.com/1756-0500/3/81
这篇关于基因芯片数据分析的文章中给出了一个数据, 是转录组学非常具有代表性的数据.
其中运用到了聚类分析,pca分析等.
数据非常现代!
期待大作!
本来非常期待模型一章,特别是关于广义线形模型的部分,看来只能期待下一本书了!

yihui yihui 2022-12-16 20:18:12

很好!文章看起来有点长,不过似乎并不太难。我抽空读读,争取能用上。这学期我正好也在上基因芯片的课。

模型部分很可能会到姊妹篇《现代统计计算》中,不过到目前为止这还只是设想,这是更难写的内容,我肯定没这个能力。等我写完图形之后希望能聚上十几号人一起写计算。

——原帖发布于 2011-03-02 13:26:40

yihui yihui 2022-12-16 20:18:13

这篇文章大致扫完了一遍,对基因芯片数据来说可能确实是一篇合适的介绍性文章,但对一般读者来说可能过于专业,尽管我现在了解了一点基因芯片的背景知识,但读起来还是吃力,毕竟专业名词还是太多了。

最关键的一点是,我读完不知道作者们想下什么结论,究竟有什么发现(除了介绍软件之外)。还有,我看到用Times New Roman字体排版代码的文章就会皱眉头……

总之还是谢谢啦!

另外,这是2010年的文章,看样子生物信息学中还有充分的阵地供统计学家“入侵”啊,哈哈

——原帖发布于 2011-03-04 11:01:54

giscus-bot giscus-bot 2022-12-16 20:18:17
访客 *zwdbordeaux* @ 2011-03-08 01:08:32 写道:

呵呵,确实有点专业.这个文章是个方法介绍的,没有涉及太多生理学背景.
其实现在在基因芯片过程中用到的数据处理方法均可用来处理高维数据,应该可以宽泛的介绍某种类型可以传达那种信息就好了.
现在转录组学学(基因芯片),代谢组学,蛋白组学等各种高维数据均采用类似可视化方法. 如果你已经运用别的例子解释了主成分分析, 热图, 聚类分析, Venn图等的运用方法,那么这么这些图形便可顺利应用到组学分析中了。

期待大作!

giscus-bot giscus-bot 2022-12-16 20:18:17
访客 *yanlinlin82* @ 2011-04-01 19:59:38 写道:

生物信息学里几乎所用到的每一个方法背后都有相应的统计学模型在支撑,而且这些模型的各种假设都在随着研究的推进在逐渐需要改进,我现在觉得,统计学家真想入侵的话,生物信息学到处都是充分的阵地。

@yanlinlin82

giscus-bot giscus-bot 2022-12-16 20:18:08
访客 *Gang Chen* @ 2011-03-05 09:49:06 写道:

层次聚类和时序数据都可以试试基因芯片的数据。我可以帮你处理成矩阵,时序数据可以处理成一个个的矩阵:)

化学数据,不知道核磁共振得到的代谢组学的数据算不算。通常都是二分类的比较研究数据,实验组和对照组,然后会有一些代谢物的量化数据。

BTW,是不是有必要在书里面写写如何编写R的图形设备?前段时间看了看如何实现HTML5的图形设备,发现有些意思,但资料不多。

yihui yihui 2022-12-16 20:18:14

1、基因芯片数据:好啊,但是你得帮我解释清楚背景,假设读者只有高中生物知识(或者更少),对你们说的那些基因一无所知,聚类出来的结果不知如何解释(这个基因跟那个基因在一类里表示什么意思,有什么生物含义)。

2、化学数据:算,这个很好,符合我的期望。之所以特别要求化学类的数据是因为我觉得仪器测量不像人的嘴那么没谱,另外据过去的一点点经验,对这类数据做主成分分析通常能看出明显的特征,而不像社会科学中那样,搞个主成分分析怎么解释都能解释通,智商情商什么的给你扯得天花乱坠。

3、我写不了,没这个本事。我只介绍了图形设备怎么用,要论怎么写,我可是一点都不知道……

——原帖发布于 2011-03-05 10:00:46

giscus-bot giscus-bot 2022-12-16 20:18:15
访客 *Gang Chen* @ 2011-03-05 10:15:37 写道:
  1. 好的,我觉得学过基本的中心法则应该就能理解是怎么回事。下周我整理给你。

  2. ^_^,好的,这个也下周整理给你。

  3. 哈,等我啥时候写书了,我就在书里面显摆一下。不过,估计感兴趣的人确实不多。

yihui yihui 2022-12-16 20:18:16

好,多谢了!

那个中心法则我每次看着都觉得像“中间的狗”……

——原帖发布于 2011-03-05 10:28:23

giscus-bot giscus-bot 2022-12-16 20:18:09
访客 *nop* @ 2012-11-14 09:48:30 写道:

做做computer vision的应用吧,会让你很兴奋的

Sign in to join the discussion

Sign in with GitHub