新西兰应该是最全的奥大统计系介绍了。。。。


在新西兰



小弟不才,在这里跟大家介绍下奥大统计专业。虽然之前有在论坛里不少帖子介绍统计专业了。
但是,基于这专业是特殊地不按常理以及频繁地变动,这些帖子已经不是太联系到现在,我想在这里向大家提供一下至今为止统计从undergraduatephd 课程所有信息 希望学弟能更好地选择适合自己的课程,少走弯路。
(大家觉得写得好或有用的,也不要吝惜,评个分,赞一下。特别是版主可是firstclass优秀毕业生,有啥不对、不足,手下留情,别拍砖,写得客观的,就给学弟我来多点分啊金币啊什么,给个精啊,谢啦谢啦)


平时潜水多,粗略介绍一下背景增强一下可信性。


当过210tutor 做过310,320tutor 有时当当labdemonstrator。刚结束honours那一年,学校苦逼码农待业中。。。


(难易度在此处是对比其他统计paper而言,例如最难的顶峰是783,我就拿其他和它对比。介绍中还会涉及偏文偏理的问题,
凑合着看咯,普遍来说,统计是文理兼有,本科偏文部分更多。很多时候决定能否拿A+的标准往往不是因为不会作算数,求导,而是考试中的小文写不好。统计aveage难度要比数学物理的aveage要简单,但这两年没有见到过华人能文理兼修的学统计,例如数学好的未必读302/767/766好,文笔好的难过710的坎。)

奥大课程分析:

从stage 1 到phd 课程,无错,这次 压箱底的phd课程也一并给出,不给个精啊,或者给少分啊,那简直就是天怒人怨!!!!!!

先综合陈述一下我对stage 3前课程以及stage 7课程(post) 的最大感受。

大量课程结构是,前部分复习以前所学内容,后部分讲述本文内容,讲不完快速结题然后寄希望于下一张paper来给学生说明。

首当210,前面先是125复习,中间是210的真正内容,统计理论--- likelihood parameter estimation似然参数估计,最后一部分突然又跳到310Normal/t distribution. 然后就是208, 前面108复习,最后一章介绍326,330。关键这样还要考考你。

除了垂直相关,还会水平相关,最近的有210与225,上一个层次是320与325,310与325等。大部分理论课类型paper都会照顾学生到无微不至地解释地步,结果课程内容一缩再缩。大家可以在325课程内看到past 210的书, 比现在210多了整整一倍内容,可以说是210+225。

700的课程有一个共同特点,总是永远不会告诉你之前需要什么课程准备,到处雷区,进入了就是艰辛等死的节奏,幸运好一点的读过了相关paper,非常轻松,运气不好的,像我,多次中,一门课学成2门课,所以仅以此文分享与大家,勿走前人中招之路。



公理1 顺序最重要


很多课彼此之间都是相通相关的。例如,读了210还可以读225,但读了225就不准读210了。这个漏洞不知道部门什么时候能去填。还有,两个相关的paper,320/325,读了325再读320就更简单,但325能留到700的时候念,能念补充内容,相反320却没有。(虽然以前有720,就是320的进阶课程。)又或者,到了post阶段,技术性留简单课到最后来冲first class。


公理2 名字比编码更没有意义


本科阶段有分为 01线,25线以及10线。


01线是以101,201,301为首,虽然330是写明advancedstatistical model,看上去好像是201的进阶,其实不是,更多的分析在下面。相反301的内容基本都是201的内容,只是用了一个新软件去做。


10线是统计的理论方向,以210,310,710为首,虽然题目不进相同,但奥大就是这样的了,就是要和你玩文字游戏但内里有着自己的坚持。这三门总结得到的其实是asymptotictheory的一步步演化解释。210及310则重用力likelihood解决相关单变量,多变量的问题,710回归到CLT,Asymptotictheory 的核心,陈述10线的在推论中的合理性。

(注意,很多年前是有一门由Ross执教的graph in R叫110,不在10线范围。)


25线是统计的随机/概率路线,125,225,325为首,国外大部分职业考试的概率知识都能在这线上找到相关内容。新课程225,我没上,但课程内容上写上了momentgenerating 妇女ction,专门用在快速求解,在精算考试中会大量用到,也很合乎Ross计算系老师授课的特色。325则是更多地研究conditionalprobability,maths induction and markov chain,是700papers 中偏数学/计算类型paper的核心内容,尤其markovchain,老朋友了,就是没读325,打基础不好,做题可烦了。(就算没读325像我这样,很多paper要用到MC的话,还是会稍微介绍一下的,会在下文对必修课选读的方法介绍一下) 基本上,把25线以及10线都读了就基本呢能够满足日常统计推论,概率等比较数理方面的需求,并不是非要把数学,尤其applied方向的学上去,applied的数学大多为物理服务,统计上还真没有多少典型问题要用到很高深的擦亮calculus技巧。再次,phd例外,喜欢数学的例外,只喜欢数学应用的也例外。我对数学 作为double major的强烈不解是因为真的要能为统计服务的要去到700的系列(勉强上是这些,761、762、763、769(key)、770、786、787、789)。如果非要数理统计,例如写几个特牛B的数学随机模型啊,那还是先把数学读完honour再考虑统计吧。



难易度解释:


关于难易度,基本上,每个专业的学生都会说自己专业难的了,在这里我比较倾向与大家讨论,在准备不充分或充分下的难易度。

个人认为,如果按照prerequisite要求(准备充分), 大部分课程都很简单。这里描述一下统计里的难的定义。

难(“/”指either or ):有答案也看不懂 / 需要学了很多其他课程才会觉得这门课容易/ 老师评分有高度的主观意识/上课学一样,做功课又另一样/

简单分为:简单到并不需要去学/听recording都能学/



Stage 1


101/108 Introduction to Statistics

以前的101会比较简单。现在多了描iNZight的部分,ChrisWild的软件iNZight居然还能在高中教bootstrap,凭借这个拿了教育奖,顺理成章,101里现在也有了。配合动画生动解释究竟statistics(mean/differenceof mean/median) distribution 是怎么回事。



125 Probability and Its Applications

简单到并不需要去学, 可以上网看看就学会了,或者在 210/225里再学,非要说它存在的必要性是,如果有同学致力要考精算的概率考试,这门课已经涵括40%的内容了,以前的125更有对betadistribution的讲解;虽然难的在后面的225,710里,但出现难题的概率还是相对低的,对自己有信心的同学可以透过学习这门课做准备,进行越级挑战。


150 Lies, Damned Lies, and Statistics

在与女友共同学习philosophy 105G时,会见到很多对evidence,valid,strong等词的逻辑描述,我好奇为什么统计本身没有,后来答案发现就在150里。


以上3门没读过,不清楚难度,只是做了一遍卷,觉得很可以,以及参考了一些读过的人的意见,如有不对及遗漏,欢迎补充或指出。


Stage 2


20x Data Analysis

延续了101,我在奥大的第一门统计课。今年换了格式,其中考不再是纯选择题了,提高了些许难度。其实,现在本地高中学的统计的程度甚至有些超出101了,我在想会否有一日,允许可以在高中读统计的了可以免读101而直接201。起码,我这个例子 是没有学过101而直接201的。



BIOSCI 209 Biometry


内容大致跟stat20x一样。除了,

BIOSCI 209 teachescomputer based data analysis for BIOLOGY students. It is very similar to STATS20x but includes Nested ANOVA, an introduction to multivariate statistics andexcludes Time series.

Topics studiedinclude:

Exploratory DataAnalysis, the analysis of linear models including two-way analysis of variance,experimental design and multiple regression, the analysis of contingency tabledata including logistic regression, multivariate analysis and model selection.

与20x不一样, 取消了time series 部分,却换上了multivariateanalysis and model selection。个人觉得会比20x的time series部分更有用,毕竟不是每一个人也会选302(后议),而326的time series会讲得更详尽,而20x会有点太简陋。而multivariateanalysis and model selection在现实工作中更有用。

唯一要注意,有些科目要求biosci要B+,相反要求20x的读过就好,大家都是统计系的老师,厚此薄彼,毕竟不是同一个爹嘛。


210 Statistical Theory

前部分复习125知识,中间学likelihoodestimate。难度视老师决定。。。。有一届,Andrew教,整得人可惨了。烦,特别多assessment,比较烦,对自己自学能力有信心,直接225吧,我比较prefer225。Rachel教得太慢了。

假如undergraduate3年都没读210,又想读post,又已经有statsmajor了(例如301,326,330无需210,但已经帮你构成statsmajor了)还有最后一个机会,在summer会有隐藏课程390,自学一遍210,非常容易拿A+,进了post就可以申210 tutor了(负责tutorial,工时多,改卷容易,竞争大。貌似同是390的A+会比210的A+要更好申,亲身经历。)



225 Mathematical Statistics

统计系终于认识到自己往日方针的苦楚,决定新加开一门数理统计。暂时,部门有漏洞,先上210,可以再上225,先上225则不能上210了。

但是225 的Prereqs:STATS 125, MATHS 150. Coreqs:MATHS 250.

210 无,只有Coreqs:15 points from MATHS208, 250 or equivalent.

225比210要求数学证明、推导更多,定位在概率方向。210是推论方向(inferential)。

如果想数学读到253之前(maths 260,270 因人而异),读这个吧。Momentgenerating 太好用了。

想考精算的同学更加要考虑225,因为210根本帮不了你这方面。有兴趣的同学可以打开325 course website看past 210的课本,里面有最80%的精算概率部分考试内容。



220 Data Technologies

没读,但课程简介看了,

Topicsstudied include: How to Write Computer Code;Publishing Data on the World-Wide Web (HTML); Data Description and SemanticMarkup (XML); Data Storage (File Formats, Spreadsheets, Databases); DataManagement and Summary (Database Queries, SQL); Data Processing (Scripting,Pattern Matching, R).


非常贴近实际工作需要。回顾我现在的工作需要,非常需要一门课快速学习与之相关的使用及操作。没读compsci就读了吧。

不读也行,但自学,累。宁愿自学统计,不自学CS;宁愿自学CS,不自学maths。



255 Introduction to Operations Research

中文叫运筹学,研究优化问题,accounting331里也有。比较简单,也是0基础就能学的课,例子仍然是我自己,当时来的第一学期与255,208,maths208一起上,感觉3门课一点联系都没有。

当时想读honours数学也不够时间读,又怕没有2个major,就读了255,因为255+320+engsci391就有多一个major了,后来发现其实也不需要这样。

在这门课,第一次上GeoffreyPritchard的课,任何想学习在优化/金融方面的统计,都要上他的课,而且难的都是他。基本上是一个不善表达的老师,注意做好笔记以及勤看书,那这门课就简单了。





评论

Stage 3
到了stage3 大部分paper都有post的版本,post学生上stage3的内容,不过追加post的内容。
301/785 Statistical Data Management
简介,1.学用SAS;2. 内容还是20x的内容。
785部分是fitting non linear的model。应该是post最简单的paper。
这门课虽被定位stats 761的Prereqs,但是,尽管不读301/785都能念761,而且没有任何跟进上的难度。
这门课有趣的地方是,它简单,使每一个跨专业或从海外大学过来读post的学生了解本校undergraduated的paper。最关键是,它是唯一一门有summer搜课的post paper,在竞争激烈的post阶段,一个学期能只上3门课的优势太大了(本地生就没关系啦,随便parttime上学。)
还是老毛病,Andrew的主观偏好很强。
早读301的好处就是如果2semester 高分通过,那summer 的301工作基本上就定了。Summer定了,之后 第一第二学期也基本定了。

302/767 Applied Multivariate Analysis
爱上这堂课了。Multivariate Analysis 是经典统计的内容。
老师Brian教得非常广,本科302还可以,但正如大部分stage 3 的课程是被阉割的 版本,上post 的767更能彻底弄明白这门课的精粹所在。
有人认为老师主观意识强,但由于这门课核心非常抽象、非常需要高技巧去描述,post阶段亦按排名进行计分,本人觉得是所有3xx/7xx 课程中最难的一门。
据了解,其他课的tutor均要A+成绩,这门课A就可以了。A+难拿,302会相对简单,因为不排名以及老师手下留情;767绝对严格要求。
(实际上,这门课在国外是很数理的课程,需要pure maths中metric 、 norm的理解)
推荐课本是short loan 蓝色课本,multivariate analysis prime.
回到正体,此课,302 部分讲述 description data,produce hypothesis;
767 部分讲述 multivariate analysis (linear model part; non linear 会在进阶766提及)
非常推荐767版本。

310/732 Introduction to Statistical Inference
2011年是本届dean 教,现在Andrew。后者相对容易。前者甚至在考试的当中连续改错试卷内容。实际上,当年我就是前届老师教,考试当时试卷给出了答案,但还要我们去换算matrix,发现后,及时更改,错的更远了。
是210的进阶课程,讲述likelihood estimator。有部分内容与325一致。
继续奥大传统,国外大学的同类型内容,会是732内容,在310里缺失的那部分说多不多,但重要性还是有的,让你能更好地理解,尤其loss function及decision rule也是经常涉及的内容。上了310,这些就要自己自学了。
但310能提供的好处是,有310的背景,在honour阶段能选更好的topic。但732又比较完整地解释了这一部分的内容,如果想在honours时,做一份比较拿得出手的的项目,那取舍就看个人想做statistical theory (310)还是applied statistics(325)的内容了。
Tutor方面,310A+就已经足够申请tutor了,现今见到要phd 程度才能执教310的tutorial。补充,210的tutorial honours 及A+就可以申请了 。


320 Applied Stochastic Modelling
只有undergraduate才有的课程,经历了soloman – david – mark的阶段,难度不断进化。
与概率有关的post paper均要320/325作为准备。先学325再学320会比较简单。但直接学320不代表就可以不学325了,在实际中应用更广。325涉及markov chain (MC)的机制,320涉及如何运用MC在实际生活中。
是其中一门必选的operational research paper。
个人意见,没有数学专业但自问数学有点小聪明的,应该选这门,把325这个简单的留到post。
以前有相关的课,
STATS 720 Stochastic Processes
Prereqs: STATS 210 and STATS 325
For Advice: Ilze Ziedins (ext. 85051), Geoffrey Pritchard (ext. 87400), Mark Holmes (ext. 88679)
A range of stochastic processes are covered in this course.
Topics will be selected from: Continuous-time jump Markov processes, point processes, renewal theory, martingales, Brownian motion, Gaussian processes, and inference for stochastic processes
Search for class timetables. (Remember to untick Show Open Classes Only!)

STATS 724 Operations Research
Prerequisites:         STATS 325 or STATS 720 or a high mark in STATS 320 (at least B+)
For Advice:         Dr Ilze Ziedins (Ext. 85051)

STATS 724 is a course about stochastic modeling and optimization that follows on from STATS 320 and STATS 325. Students should have done either STATS 325 or STATS 720. Students who have done very well in STATS 320 may also be allowed into the course- please see Ilze Ziedins if you fall into this category. The course will cover a range of stochastic models, giving both theory and some discussion of applications. The emphasis will be on Markov models. Some queueing theory will be presented as part of the applied section. Some computing experience (a working knowledge of R or Splus or Matlab) will be useful.
Topics covered may include: Markov processes in continuous time - definitions, Q-matrix, recurrence, stationary and limiting distributions, migration processes, reversibility. Queueing theory, including material on queueing networks. A key component of the course this year will be Markov decision processes and optimization. If time permits, the course may include some additional material on renewal theory and semi-Markov processes.

326/727 Applied Time Series Analysis
统计系一直致力于统计描述。Report总是强调第一句,assuming independent.
326 与其说是time series 那不如说它教你怎么去remove dependence in time data。
大部分的技术是说怎么去trend effect, seasonal effect,怎么调整模型能达成assumptions。
要是想研究更多的time series模型,请考虑经济系。
要是想研究怎么写出time series 的模型,stats 726。
326 ,727版本的不同处是,326要求exam 第一大题写report,727要求期中写report,exam第一大题换成默写里面书的选学部分中的公式。
非常建议,选326就算了,除非对自己report能力严重质疑,觉得自己数理好,那才727吧。
(个人亲身经历,coursework成绩在最后会公布,当时数了一下自己成绩全班第6,结果考试出来,与大部分认识的人一样拿A,自我感觉是第一大题答太烂了。。。)

340/741 Design of Surveys And Experiments
我没读这门,但认识的几个phd会叫我还是把这门修了。
前部分,survey:
统计的本质就是样本。这门课在教你怎么样在样本上做文章,根据之前在lab选这门的学生问我的问题。
大家选读这门的可以留意一下,任何统计设计/实验的第一门随机性是任何实现,不同的方法又会达成多少比例的随机性。例如,在街头随机抽查吃收入的研究,与高中门口抽查收入的研究,用后者的样本所推导的总体情况总是bias。
后一部分,其实本质就是ANOVA:
今年教得狂烂,几个朋友在读这门,得到的信息应该没什么参考价值,欢迎读过的补充。。。。。。
741部分是一些总体的推论以及如何管理survey。
个人觉得,这门课读3还是读7,也没有太大分别。甚至,想读740,750(后面介绍)的,可以忽略这门。。。。

325/721 Stochastic Processes
有些比较难的课(726,731,783)需要大量用到markov chain的支持,去寻找stationary的状态。推荐课程上写到金融相关,实际里面大量与生物相关的例子。对自己有信心的又想读finance方向的,选择723吧。早读325给我比较大的意义是能提供更早机会去接触以上那些难课。虽然这些难课里也会讲述一下markov chain,但个人觉得并不太足够,往往是说的一套做的一套。
由于我没有读325,所以在上以上课时,会花比较多时间去补充关于MC的知识。
721内容是martingale(评估风险时中常用到)等内容,很多人反映较难,但出来成绩还是可以。授课老师是之前255中出现过的Geoffrey Pritchard, 成绩好看他,他是那种一个不小心(就自己觉得容易)就会出得很难的人。
在后面的一门只有他任教的723中,也会继续涉及martingale,但涉及modern conditional probability。 在325里,他只教class conditional probability。 有心想在这方面涉猎更多,应该留到721才学,这样可以对比两种不同的理解。选择325的最好还是有一个强烈理由,例如只想读到honours然后写有关这方面的课题。否则,721确实是post阶段一门相对简单拿高分的paper。
备注,如果想去国外深造stochastic process的,注意stochastic process 并不等同probability,还是留着吧,这paper也是大量被阉割的好例子。

330/762 Advanced Statistical Modelling
从第三年,开始有30线(实际后接730,但给人感觉730的名字就像是310那样)的出现,主要讲述GLM。
这门课没啥好讲了,投入了奥大的很多精英力量去开发当中被使用到软件包使之适合教学。选就一定得选的了,问题是762还是330。
762的追加内容重复了310最后1章的内容,linear Gaussian  model ,anova。我当时是学了310的,之后选择762的版本。提供了一个更直观的角度讲述如何把multiple regression 投射到空间中。非要说新的,就是762部分老师Arden让你不用function自己用矩阵做一遍linear Gaussian  model 及 anova,程度不会很难,就是20x常用到那些。
个人建议,选读762 的版本。现在CS出了一个一年期的data science专业,其中能接受762,因为里面已经首次介绍了不少model selection的方法有关data mining及machine learning了。


331 Introduction to Bayesian Statistics
第一门课讲述Bayesian,往年真的很简单,归纳为教你如何用WINBUGS。
统计系被嫌太简单,年年改革,今年331就改革了,突然变成解释Bayesian inferential的简单distribution部分。
后续版本731,虽然有写需要331,但个人感觉并无太大 差别。
有兴趣要早读731,783的同学,对自己 数学不是说信心爆棚,325又不想这么早读,那就先读它吧,毕竟331是没有post版本的。

Stat 370 Financial Mathematics
经历了soloman-david,还是相当简单,被阉割的异常厉害。
第一部分是interest theory,在实际工作中,学了370只能让你开个好头自己学习,毕竟很多情况不能只用i去求FV,PV。
第二部分是portfolio theory, hedge fund 要用到的basic 计算会在这里说明。Maths208里的Lagrange Multiplier会在这里从现。
722部分基本等于无,印象中,2012年,在assignment中出了一个hyperbolic distribution让我们自学。
顺带一提,它可以作为maths stage 3 paper。
个人建议370。 722太少人读了,当时一个不小心写错了一小问,直接跌到A-了,我想是ranking了(基本上,3/7都有的paper会有ranking),我想370应该会拿过A+,因为真的比较简单。

Stats 380 Statistical Computing
非常不知道怎么形容的课程。起码,它是简单的。但因为太简单了,根本没有接触到R的核心所在。
前部分是教R怎么做numeric 运算以及简单optimal。
后部分是教如何从website提取dirty data 然后转格式自己使用。不知道CS什么paper 能教后部分,在实际工作中,后部分非常有用,至少站在统计学的工作者来说,毕竟你也没有那么多经费整天大型survey,experiment,从网上提取数据是比较折衷的方法。
Ross现在发脾气说自己不想再教post的R了,教太多,闷,走去教225,还是留在380里。但今年782没有他教,惨不忍睹,明年或者回归。
真的不想念CS,又对自己自学的动力没有信心,好歹也把220,380也念了吧,如果还有paper的话。

Engsci 391 Optimisation in Operations Research
没有读。以下是官网原抄:
It provides an understanding of some of the mathematical ideas underlying the computer packages used in STATS 255。

总结一下,undergraduate 24 papers版本
如果single major statistics, 310,320,326,340,330。

如果double major 那就比较难学得方方面面了。
文科,340、326是最好找工作的了,在工作中也用得广泛,前者marketing,后者economic类型
理科,CS首要325,331,这两个都与CS后的数据挖掘,机械学习相关。数学的随便挑了。。

conjoint的也基本上是随便挑了。

评论

纯stage 7:
纯stage 7paper 的特点是:
1. 这门课会是之前stage 3课的后续
2.提供某个主题的广泛介绍,注意是广泛,很多老师定义他们的课是让你学了能在这个领域里自学,做研究。这类型课会经常看到phd 旁听。
3. 某些特定领域的课例如生物,医学的,讲得比较详细。这里可以按照handbook上的指导,选择与该领域相关的其它paper。
4. 古怪课程,老师的课表内容,极难找到与之相符的其它学校的课程notes 与笔记
5.自成一格,官网上的内容已经足够参考了

710 Probability Theory
类型:1,3(数学)
重点请各位看好:Prereqs: STATS 310 or 320 or 325, (or MATHS 332 and permission of lecturer)
有前面的背景(学得好)至少能通过 ,没有括号内背景难拿高分。
Modern probability
很多国外学校定义为数学课,是measure theory(奥大编码maths730 measure theory)在[0,1]域内的研究。
任何立志研究新型distribution 甚至开发新的distribution 这门课对他们才有用,这是相当多老师对这方面的理解。
还没学,14年第一学期,有想过挑战。
虽然内容简介内没有列明,这课的所有内容都在试图解释Asymptotic theory上,因此才被冠上10后缀。

723  Stochastic Methods in Finance
类型:4
For Advice: Geoffrey Pritchard
Prereqs: STATS 210 or equivalent, or with consent of lecturer
绝对不要相信这个Prereqs。 在美国等地,710,723是一前一后的关系的。
今年我在读,被谣传考试简单。老师向我承诺尽量出简单,但我没有相信,尤其是现在门门课都在改革。
我个人意见是,先不管成绩,有些课真的勉强去读,就算过了,也学不了多少东西。起码这门课有以后读完710后再旁听一次的打算了。
现在似乎内容也改变了。
读完后再更新。

726 Time Series
类型:2
今年726可精彩了。经济系的也来读,工程系做老师的也来读。
往年改分很松,还开卷。
还是那句,统计系的评分标准频繁变动,十分不明确。
没有必须修过326/727的背景,但修过726了,326/727就显得没什么必要了。
身边朋友有在读,自己无读,所以评价不算十分客观。

730 Statistical Inference
类型:1,2
看上去就像是310加强,Prereqs也要求310。
但两个体系其实相当不同。730延续30线,讲解在330在出现的statistics是如何求得,如何保证其准确以及合理。还会介绍Mixture model以及比较frequentist 与 Bayesian 之间在实际工作中如何取舍,介绍不同的作inferential的工具。 建议如果不是铁了心的Bayesian 分子,不想读731,还是把这门修了。在旧phd的要求中,782与730都是大部分老师要求你具有的课程。
考试量比较大,但会scaling。

731 Bayesian Inference
类型:1,2
这里会涉及更深入的Bayesian model, 例如hierarchical model等。一切有关Bayesian  inference这里都涵盖(除了maximum entropy)。 但内容很广,我以Harvard 以及Berkeley 的notes作对比,H 偏应用,B偏解释数理,咱们奥大的牛B,啥都说一下,反而两方面都不精了。其实我更倾向把课对半。  
老师评分很松,assignment 基本是满分的。同好多Bayesian 老师一样,总是会特意安排些题目是体现Bayesian是如何beat down Frequentist的,相当有趣。
总体来说,如果没肯定自己偏好哪个学派,又想先学其中一门打好基础,偏computing的建议731,偏Inferential的建议730。 (虽然这两个整天都会在一起的,很少有人只Inferential而不考虑computing的)

740 Sample Surveys
类型:1
十分建议这门课。从数据的收集,数据质量的检测,不同收集方法对结果的影响等等一切有关统计本质工作的问题都会在这里有介绍。课程设计相当科学。一直由两位professor级别(Alastair Scott ,Chris Wild)的来教,教材也是由另一位professor的大作(Lumley)。
虽然写着Prereqs: STATS 340 or 341 or equivalent,实际其实不需要。
一切统计的工作都由设计及收集收据开始,在340里,介绍了最基本的两个survey以及experiment。前者更适合于商业/社会人文科学,后者更倾向于自然科学。740就是有关survey的研究。个人觉得是奥大最值得读与无可挑剔的一门课程。
另外有一门750,会得到很多中国学生偏好。本人比较费解这点。据传是容易,但真的没有什么兴趣。后议。


747 Statistical Methods in Marketing
类型:5
就是聚焦marketing。选这课的人员数量十分庞大。相当简单,但比较烦,经常交作业,presentation。
如果没读302,340,尽管不是太对市场有兴趣,还是选选这门课,会跟你讲讲日常survey,pca等用法。
还没读,道听途说。

750 Experimental Design
类型:1,2,3
相当怪的一门课。也是十分受中国学生青睬。真心一点兴趣都无,真的说不了什么客观的。
Prereqs: STATS 340 or 351
唯一知道的是偏anova内容。实则觉得这门课真要深入,可以十分十分深入,想不明白为啥容易,没有读,给不了太多评价。

760 A Survey of Modern Applied Statistics
类型:5
十分多自学。内容大部分都是machine learning有关的统计工具。
不会教你怎么去推导这些复杂的东西,只要求你能描述它们的结果。这是Alan说的。
无读。个人不太建议,尽管我也了解

766 Multivariate Analysis
类型:1,2 ,3,4
很多人害怕Brian,但他确实是一个很专业的在搞统计的人。
我觉得,人比课要吸引。课程设计,包括302,均是由他一手安排,结合了很多他的实际经验与理解所筛选出来的内容。302偏向线性的描述以及mvn(multivariate normal),766偏向非线性以及categorical data。
旁听了一门,以及朋友在读,在这里能更好地去理解302的内容。由于这范围是传统统计的工作内容,现时很多市场分析,machine learning等都需要此处的相关知识,建议选择统计本行业工作的读一下,更能理解统计。
老规则,需要较强的描述能力。

评论
必须computing 2门选一:
779 Professional Computing Skills for Statisticians
782 Statistical Computing
我选了782。
两门课今年都有不一样的改变。782评分标准怪,但没有人不合格,779出现有人不合格。
先说说选择的标准:觉得统计只是一门工作的工具的话,选779;想成为专业的统计从业人员,782。
原因十分简单,现今先进的统计方法不断更新,故有的统计软件SAS,SPSS,根本无法兼顾及开发computing的工作辅导这些新的统计方法。782能教你R最核心的部分。782能在学校等部门提供你更多工作机会,例如research assistant,更是挑战783,784必须的支持。
普通办公室文职,或想专心在SAS的软件上的,779足够了。(十分多不同类型的软件介绍,对自身自学能力有信心的朋友还是782吧)
在老师心目中的难度,该是779是782的准备,尽管两门课并restriction。
需要说明的是,两门课都有不同程度的赶不上当今statistics computing的节奏。

Advanced computing:
如果710/723是理论的恶心,那这两门课就是贯彻始终的恶心。难,但值得读。基本上以上所说的所有介绍,但这里都是教大家如何准备挑战这两门课程的。范围极度的广,官网介绍十分不靠铺。在国外不同学校,因应该学校不同擅长范围,而把782的内容与783或784其中一门相结合。简单的说,783偏theory statistics,784偏applied statistics。
具体内容每年都会因应课程时间有变动,详情请联系该课老师。
783 Simulation and Monte Carlo Methods
最轻松准备:731,730,782,320,325,310,maths270 (这样配置应该很轻松了。)
可以称为足够准备:730/731,320/325,maths270,380/782
傻B挑战配置:320,310
授课相关内容就有以上“最轻松准备”的相关内容。那样就会轻松很多,那这门课就是一门教你怎么提高算法效率的computing课程,因为theory都准备好了。老师相当能人服气。学生作业在R走最快1分钟的项目,他设计了33秒。。。从generating random number& test, bootstrapping, model-selection, monte carlo method(从此统计学生再也不用担心不会求复杂function的积分咯。),markov chain monte carlo method find optimal parameters。
当时我是傻B挑战配置,可悲摧了。。。。。。。。难听点形容,别人一个dissertation programming 部分就已经等于一个assignment。这个例子有点夸张,但实际上,上这门课的人,高手云集,phd至少5个(当时),还要ranking,还只有我一个中国学生,完全没有什么抱团抄往年作业。。。没有。。。老师自身对自己教theory十分有信心,本人觉得至少把731上了,上这门课才能学得value 的东西。



784 Statistical Data Mining
一定需要读了782先 。782,784一起读会作业量有点大。
Coreqs: STATS 310/732, 730, 782   绝对bullshit
更加偏向CS以及统计的结合。前部分花相当大笔墨介绍相关的电脑部分。后部分讲data mining中statistics有关的部分,正如题目上写的。
还没读。还不能给出中肯的答案。老师给分十分严格/严谨(第一章就给你扣什么是数据挖掘这些字眼了,能不严谨吗),实际上今年782由yee教闹出了很多问题,明年应该他会卸任,但784的评价则没有任何积极或消极的影响,虽然因为他对我做的某些行为太过分,令我782成绩差,但还是很客观的说,他只是不熟悉782 的评分标准以及我确实太多小问题让他抓,784还是相当值得一读的。但是!如果有第二个老师教,我想我还是会选第二个老师。(例如,选CS那边的data mining)

BIOSCIENCE
BIOINF 704 Statistical Bioinformatics 2
讲述DNA,基因组学,考试大量背书内容。注意里面会有讲解 linear model 当(n《p)。之前的课程我们只会接触n=p,或p>n的线性模型,有志研究这领域的应该听听。

BIOSCI 738 Advanced Biological Data Analysis.
里面有302的部分内容加750的部分内容,而且它教的302的部分更容易理解。
读此门paper ,最体现其价值的是,当生物honours degree(本科阶段没有统计专业)时,读这门加上选2门统计(每个degree都能在项目里选最多2门非本专业课程),就能读统计了。(注意,学校是你能任何paper 的如果达到该paper要求的话,但要拿post的专业最低要求是不能读超过3张非本专业的paper,否则没有证书)这门课就是这样规避了这个风险而能从生物跳入统计。

MEDSTATISTICS
770 Introduction to Medical Statistics
没评价,反正要拿这个专业,都躲不开读的。
773 Design and Analysis of Clinical Trials
没评价,反正要拿这个专业,都躲不开读的。就是临床试验那种得到结果的推导。
读精算的人会想学survival model,里面有些许用到的数学,名叫time missing value。

761 Mixed Models
注意是mixed model 非mixture model 。Regression 及anova 的结合物,个人觉得。
http://en.wikipedia.org/wiki/Mixed_model
其实真的挺深的,但这课教你用软件SAS直接得到结果然后描述结果。但必须肯定的是读了340,750,761就能成为anova专家了,这确实在就业中非常的好,毕竟有多少公司真要求你推导一个新模型。
780 Statistical consulting
705 Official Statistics
只能说好玩,内容题目写得很清楚了。
没有读,但没有任何负面的评价,或任何课需要读了它们才能继续。

终于来到私人珍藏系列,phd 系列课程!!!
负责人其中之一是James Curran
there are two courses, one in each semester that are being offered by the department for those students who are either in their provisional first year of a PhD, or who are intending to go overseas and do a PhD. The courses are STATS 702 - which is statistical theory, and STATS 763 - which is applied statistics. They are 700 level papers as you note, but they are also taught at a higher level, because, as I said they are for people who are doing a PhD.
Stat 736 Advanced Applied Statistics
Aim
This course is an advanced course on the primarily on theory and application of
modern regression techniques. The course is aimed at those students enrolled in
a provisional year of a PhD, or for those intending to undertake further graduate
study outside of New Zealand.
Lecture sessions take place in the departmental meeting space. The lecturing style
will be informal and discussion will be encouraged.
Course Topics
The course covers the following topics:
_ The uses of regression
_ Specialised methods for prediction
_ Smoothing
_ Bootstrapping
_ Censoring
_ Generalized linear models, sandwich estimation
_ Mixed models
_ Applied Bayesian modelling
Date Lecturer Topic
26 July
Lumley Regression - what is it for: Prediction and inference
August 2, 9
Lee Prediction: CART, regularisation/averaging, bagging, lasso, boosting.
August 16
Yee Smoothing: linear and cubic regression splines, psplines as regression
splines with regularisation, kernel smoothing.
August 23
Giurcaneanu Bootstrapping: A general approach to get standard errors for almost everything.
August 30
Lumley Censoring and related issues rightcensoring of time to event, right and/or
left censoring of assays, left-truncation of time to event. Difference between death and censoring . Competing risks and identifiability. The Cox model, parametric models for censored data.

September 20
Curran Generalised linear models (as semiparametric models for E[Y jX]). Logistic
regression, Poisson regression. Sandwich estimator as an approximation to the bootstrap for overdispersion or misspecification. Interpretation of coefficients, especially interactions.
Distinction between confounding and non-collapsibility in nonlinear models.
September 27, October 4, 11
Triggs Mixed models
October 18, 25
Meyer Applied Bayesian modelling

Stats 702 THEORETICAL STATISTICS
In which we learn about basic mathematical statistics, bringing the traditional course up
to date by considering estimating functions more general than the score and by mentioning
some results for dependent data and in_nite-dimensional objects. Some of the results will
be proved in detail, so that the student becomes acquainted with the techniques of proof.
Others will be stated formally and used in proofs. A few results will be stated informally,
because a formal statement would require mathematics beyond that we can assume.
The course will be o_ered in _rst semester. Each week, students will be given reading
and exercises to do, and these will be discussed in the class session. There will be several
instructors. The class will meet on Fridays from 3pm not quite until 5pm, in the 3rd-oor
Statistics conference room (303.310) except on May 24, when we will be in the 4th-oor
conference room (303.412).
There will be a take-home exam.
(1) March 8, David Scott. Of random variables. Distribution functions, probability
mass functions, measure as notation combining discrete and continuous cases, ab-
solute continuity, the existence of densities
(2) March 15, David Scott. Of the modes of convergence. In distribution (de_ned by
convergence of expectations), in mean, in probability, almost surely. Almost sure
representations demonstrated in the univariate case by the Skhorokhod construc-
tion and asserted in general.
(3) March 22, Alan Lee. Of the limit theorems. The LLN and CLT in iid cases.
The Kolmogorov LLN. The worlds simplest ergodic theorem (LLN with summable
correlations). The statement of the Lindeberg{Feller CLT and some motivation.
(4) Easter break
(5) April 5, Alastair Scott. Of transformations. The continuous mapping theorem and
the delta method. Handwaving for in_nite-dimensional parameters.
(6) April 12, Alastair Scott.Of likelihood The Neyman{Pearson lemma. Su_ciency.
The unbiasedness of the score equation. The information equality.
(7) April 19, Alan Lee. Of consistency in one dimension Monotone estimating func-
tions. Convex likelihoods. Local consistency for more general cases
(9) May 3, Alan Lee.Of asymptotic Normality in one dimension The argument from
smoothness, following Cramer but not restricted to likelihoods and with plug-in
LLN and CLT.
(10) May 10, Thomas Lumley. Of e_ciency The Cramer{Rao bound. The e_ciency of
the mle. Statement of the asymptotic su_ciency of the mle. Bias/variance tradeo_
with Bayesian estimators. The James{Stein estimator
(11) May 17,Thomas Lumley. Of asymptotic e_ciency The complications of asymptotic
e_ciency: the Hodges estimator. The statement of the convolution theorem and
the local asymptotic minimax theorem.
(12) Room change. May 24, Thomas Lumley Of consistency in more dimensions
Wald's method. Convex objective functions.
(13) May 31, Thomas Lumley Of asymptotic Normality The classical smoothness ar-
gument, the statement of the empirical process result for functions Lipschitz in the
parameter.
(14) June 7, Alan Lee Of the bootstrap The argument for functions of means

Ok, 总结,很多往届的人会有抱怨奥大统计怎么不match世界潮流,但其实它们一直有在努力,特别是一些非金融统计的领域。由于经常要转换岗位,又或者写着写着别人有问题来问,那就会写着写着跳了或者写着中文又变英文,并非真心我所愿。希望这资讯能帮到大家。需要更多资讯请留言,我会尽量配合采集进行补充。

评论
omg

评论
我好像知道lz是谁了。。。讲的真的好细心呀。。。。
741 不想说,真的很坑爹。

732的话 能学到很多theory behind the analyse, 那些我们从20x做lm出来的estimate, 如果用手算的话怎么得出来,还是挺好的。

779的话,其实教的东西很多,也很杂,但都不细。接触topics R, word, excel, latex, MySQL, MUPAD 等等。。

705,就是写essays, 而且是由不同大学的老师一起教,有的时候是waikato, 有的时候是victoria。都是新西兰的精英们在教。不算难,正在读。。

761 的话 目前听起来就是 ass1 比301还简单,ass2的话 貌似就是regression, 也开始接触到了anova, experimental 所用到的mixed model, 还算可以吧。。目前来说。。0 0

723 也是正在读。。。感觉好高端。。。

评论
你今天和男友做shift啦,9点时?

评论

我觉得779的R部分是为了sweave 服务。。。。我论文当时想用latex写,但是我导师认为没关系,叫我上网找个模版得了。个人觉得数学推论不多,作图又多的话,latex真心抓狂。谢谢你留言哦。整天忙那边的工作也没和你们好好吹吹水。。。

评论
一年级的来膜拜下。。。

评论


评论
纯哥读过的课只有简单和超简单2种

评论
- - 火钳刘明。。。。。。。。。。。。。。。。

评论
写了多久?

评论

?????????

评论

302挺难的。来一下嘛。。

评论
学了210 还能再学125么?LZ太强了,感谢!

评论

这个漏洞走不了. 站在学校立场,他们认为学生最应该要学是likelihood estimate in 210. 但是225里的multivariate distribution theory太重要了在概率方面,从图形的角度去解概率。
真的想学只能225了,只能自学了,上325的website 找past 210 课本。
学校为了骗钱,强迫读125才能读225。但读了210又不能125,接着就不能225。反正就是乱。
或者你可以找学校聊一下,毕竟225挑明说了读过210也没关系。

评论
楼主很强大,佩服

评论
楼主强大,膜拜下~
个人感觉741 同740根本没啥差别,770很坑爹但必需修,773还是挺有用的

评论

哪里强大。。。。
以前有门课叫764,会教到time failure data/missing value data/censored data, 由我导师Chris Wild教。
773也涉及一点这方面的模型,但有点不够high,还没到点就停止了。
请问师兄740时的老师是哪位,我个人觉得741 survey部分很关键的问题,要在740里体现。
请问师兄是哪届的?

评论
强人!好奇楼主想找什么样的工作呢?

评论
火钳刘明····

评论

不强。。。。
有工作介绍吗,啥都做!!!!

评论
统计转投cs的路过。。。

评论
有个好介绍,要统计学数据分析方面的人才。Optima这个公司,强大诱人的package, HR外包,给Radius和compesek(好象是这么写)。之前招的一个职位年薪有8-11万。。
祝楼主好运。

评论


可要带带我啊。。。。
没CS背景,想做CS,做machine learning。。。。

评论


还真有。。。。感动,流涕。。。我试一下啊。谢了~~!~!

评论

不客气 给你站短了

评论
如此的牛人。。。。。。没考虑留校任教做研究项目啥的吗?

评论
LZ导师是谁啊?

顺便说说,在统计行业混了快5年了,感觉就业的起步真的很重要,否则做久了很难转行。

再说说,统计要学得好,但是也要学点统计理论外的东西。以后要在学术领域混的就不说了,要在商业世界混,起码要多掌握点Statistics以外的技能,比如SQL, Perl,Python等等的东西。

LZ加油!各位学习统计的学弟学妹加油!

新西兰移民留学

奥克兰雅思学习

新西兰请问大家,雅思高阶课程学习,有哪家机构推荐么?非常感谢 评论 您好,我们机构提供雅思小班保过班,欢迎微信加我Heidi-2014,电话咨询:021-2488850 评论 你好,可以加我微信,Heidi-20 ...

新西兰移民留学

在线RV转PRV申请材料问题

新西兰准备在线申请PRV了,有谁知道要准备什么材料吗?我看好像就提交一个护照照片就完事了? 评论 网站申请,好像就护照和照片而已。无犯罪不需要了 评论 没特别的资料要求,主要是申 ...

新西兰移民留学

关于rv转prv

新西兰昨天刚在Manukau的移民局dropbox亲身递交了rv转prv申请,不知有最近递交的嘛大概多久信用卡会扣款?多久能下来?(看移民局网站写现在处理时间90%的申请是28 weekdays,真有这么快嘛?) ...

新西兰移民留学

父母团聚AIP问题

新西兰父母团聚AIP下来,提交了护照上周一就收款并退回护照。大家知道evisa还要多久能收到? 评论 大概三周左右 评论 那就说的通了。 评论 收到AIP.第二周扣的学费。没有要护照。扣完学费 ...

新西兰移民留学

澳洲要取消父母团聚移民

新西兰澳洲既取消投资移民后又要取消父母团聚移民,他们觉得这移民对澳洲没有好处。新西兰会不会跟进呢 评论 澳洲做得好。 评论 澳洲要反滑新西兰要不要跟进呢? 评论 澳洲还关闭了投 ...

新西兰移民留学

有pr想申请奥大

新西兰不太清楚具体流程 兄弟们有没有合适的中介可以推荐的 评论 可以申请清华 评论 自己跟学校联系最好,既想上学,那么提前开始学习怎么和学校打交道,入学之后需要和学校各个部门打 ...

新西兰移民留学

2021 one off VISA 副申請人轉PR

新西兰目前是2021 one off VISA 副申請人已獲批,請問此簽證有兩年內須住滿緊接申請PR否則簽證會過期的限制嗎?因為我看過期日是無限的,是否只要我在指定日前入境就可以無限使用簽證?我現 ...