来源:北京集思未来科研辅导时间:2023/4/8 11:16:39
2023暑期线下科研·海外:哥伦比亚大学教授数据科学与统计研课题
开始日期: 2023-07-01
课时安排: 2周专业预修+2周在线科研+2周深⼊⾯授科研与实验室Workshop
适合年级 (Grade): 高中生/大学生
适合专业 (Major): 欲申请世界学校统计学、应用数学、生物统计、计算机科学、数据科学、公共卫生、生物医学等相关专业的大学生及学有余力的高中生
R. Todd导师现任哥伦比亚大学生物统计系终身正教授兼系副主任、国际统计学会成员、美国统计协会会士、英国CUMC格伦达·加维教学学院研究员、国际学术期刊Biometrics和 International Statistical Review副主编。Prof. Todd is currently a tenure professor and vice chair of Institute of BioStatistics at Columbia University, a member of the International Statistical Association, fellow of the American Statistical Association, a Fellow of the Glenda Garvey School of Teaching and Learning at CUMC in the United Kingdom, a leading international academic journal Biometrics and International Statistical Deputy Editor of Review
他的研究领域为生物统计方法论及其在各种领域的应用,目前正在与纽约州立精神病学研究所的研究人员合作,通过分析脑成像研究的数据,研究各种统计建模问题。其他正在进行的兴趣包括函数数据分析、非参数回归、小波方法、统计建模、统计计算。His research interests include biostatistical methodology and its applications to a variety of fields, and he is currently working with researchers at the New York State Psychiatric Institute on a variety of statistical modeling issues by analyzing data from brain imaging studies. Other ongoing interests include functional data analysis, nonparametric regression, wavelet methods, statistical modeling, statistical computing.
任职学校 ...展开
统计学旨在运用数理原理和方法,分析与阐释事物的本质和现象,力图把握本质规律,在经济、金融、物理、生物、医学中都有广泛应用。目前数据科学的蓬勃发展及其在金融等诸多领域的落地为生物医学和公共卫生统计分析提供了新方法。目前,Excel、R、Matlab、SPSS是范围内较为普及的统计分析工具。项目将广泛介绍统计数据科学及R语言数据处理方法,并以公共卫生为例进行前沿指导。学生将使用技术和软件完成探索性和更的回归分析,帮助学生将技巧应用到解决实际问题中,直接体验数据科学统计的潜在和重要影响。
项目内容涉及统计学和数据科学系统知识体系,以及以Tidyverse包为例的R语言,并以公共卫生领域相关问题为例进行应用实践。另外项目还包含探索性分析、线性回归分析、时间序列回归分析,模型比较、结论评估等。在项目结束时,提交项目报告,进行成果展示。
个性化研究课题参考:
R语言处理数据可视化、风险预测模型评价、基于R语言的新冠肺炎疫情时空分析及预测预警。
学生将进入到世界学府-哥伦比亚大学,在为期两周的实地科研学习中与教授、Teaching Fellow面对面交流,在实验室中将理论与实践结合,沉浸式感受浓厚的学术氛围。用餐在校内食堂、住宿在学校宿舍中、生活在美丽、静谧的校园内,学生将真正零距离体验学校文化与生活方式。
The content of the project involves the knowledge system of statistics and data science, as well as the R language with the Tidyverse package as an example, and the application practice of relevant issues in the field of public health as an example. In addition, the project also includes exploratory analysis, linear regression analysis, time series regression analysis, model comparison, conclusion evaluation, etc. At the end of the project, submit the project report and present the results. Personalized research topic reference: R language processing data visualization, risk prediction model evaluation, R language based Spatiotemporal analysis of COVID-19 outbreak and prediction and early warning technology.
统计数据科学沿革:统计数据科学在公共卫生领域的应用 Background and development of statistical data science; applications in public and biomedicine.
探索性分析:为什么(分析目标)、是什么(分析任务列表)和怎么办(Excel和R统计分析) Exploratory analysis: why (the objectives of such analysis), what (the list of analysis tasks), and how (analysis using excel and R).
线性回归分析:为什么(目标)、是什么(统计概念、数学公式)和怎么办(估计和推断) Linear regression analysis: why (the objectives), what (statistical concept, mathematical formulation), and how (estimation and inference).
时间序列回归分析:为什么(目标)、是什么(统计概念、数学公式)和怎么办(估计和推断) Time series regression analysis: why (the objectives), what (statistical concept, mathematical formulation), and how (estimation and inference).
模型比较、评估与诊断 Model comparison, evaluation, and diagnostics.
项目回顾与成果展示 Program Review and Presentation
论文辅导 Project Deliverables Tutoring
2周专业预修+2周在线科研+2周深⼊⾯授科研与实验室Workshop
与诺贝尔奖得主交流机会
学术报告
学员获主导师Reference Letter
EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等级别索引国际会议全文投递与发表指导(共同一作或独立一作可选)
结业证书
成绩单