关键时刻挺身而出,球队实现绝杀
2017年,是中国R会议值得纪念的第10个年头,本届R会议将于5月19-21日在美丽的清华大学举办。在这样一个值得纪念的时刻,让我九游体育下载们相聚清华大学统计学研究中心,相聚R会议十周年庆典,相聚这场数据与统计的盛宴!本届会议覆盖数据科学多个领域,我九游体育们非常期待您的到来,希望您的演讲能让听众更多受益,能让会议更加精彩!
中国R会议是由统计之都发起,并同国内高校共同举办的极有特色的数据科学会议。2008年,中国R会议在中国人民大学举办第1届,2016年已发展至全年9个城市先后举办,服务数据科学在校师生和业界人士数万人,内容覆盖数据科学相关的多个行业,R会议非常有幸见证了数据科学在中国的蓬勃发展。
2017年,清华大学统计学研究中心、北京大学商务智能研究中心和统计之都携手共同主办第10届中国R会议。本届会议的主题包括医疗健康、生物信息、消费金融、量化投资、工业工程、智能制造、软件工具、计算平台、概率统计、机器学习、人工智能、自然语言、天文地理、城市规划、环境科学、社交网络、政务数据、商务统计、人文科学等诸多话题。其中5月19日特邀演讲会场设于清华大学新清华学堂,20-21日将举办上述主题的平行分会场。
下面为您奉上本次R会议【心理科学】【文本挖掘】以及【智能制造】分会场演讲嘉宾介绍:
心理科学
基于社会媒体大数据的心理学研究
中国科学院心理研究所研究员,
博士生导师:朱廷劭
互联网时代的到来,能够将普通人的日常行为以空前的规模和精细程度进行记录,形成网络行为大数据,为个性心理研究提供了前所未有的机遇,也提出了新的理论与技术问题。我们对反映个性特征的社会媒体大数据开展研究,运用机器学习方法构建利用社会媒体数据预测用户个性心理特征的计算模型,并开始尝试将模型预测作为测量手段运用于个性心理学研究。这些初步工作,为网络技术支持下个性心理研究的纵深化、精细化发展做了铺垫,并开始显露出巨大的应用潜力。
基于R与Rstudio的心理统计教学模式探索
南开大学周恩来政府管理学院
社会心理学系副教授:吕小康
传统心理统计的教学模式较为依赖于纸笔运算,所倾向使用的基础统计软件多为SPSS,教学过程中统计知识与软件的结合相对分离。要促进心理统计知识与技能的学习,统计计算软件的深度参与是必不可少的,但这种软件自身知识的学习同时可能加重学生的学习负担,从而导致其学习动机和可持续性不足。本演讲将基于作者在南开大学周恩来政府管理学院的多年本科及硕士的统计类课程教学实践,说明和演示如何在教学过程中贯穿“用统计软件为统计学习服务”的基本理念,如何利用R与Rstudio简化统计教学的流程,使学生更为便利地接受R语言这一统计计算工具,同时利用Rstudio进行作业布置与管理。统计工具的大众化需要各学科内从事具体教学科研的工作人员不断提供的尝试方式,最大化地体现新工具较之传统工具的优势,如此才能形成一种良性的教学文化,使得一种统计工具真正能够在学科领域扎根并流行。
R语言在加强心理学可重复性中的作用
清华大学心理学系博士生:胡传鹏
自2011年,由于一系列的重复失败事件,可重复性问题成为了心理学界一个持续的热点问题。统计方法严谨性(如过度依赖于p值)和开放性(大量的可疑研究操作)不足是导致心理学研究可重复率过低的重要原因。为了应对心理学中的可重复危机,研究者们倡导使用更加多样的统计方法以及公开透明的研究实践。由于R语言中分析方法的灵活性与开放性,R语言在加强心理学研究的可重复性上可以起到重要作用。首先,R语言能够加强心理学研究中统计的严谨性和统计方法的多样性。由于众多心理学相关的软件包(psych,九游 MBESS, lavaan, BootES, BayesFactor, Metafor 等)使用R语言,研究者可以进行多样的统计,避免过度依赖于p值。例如,使用BootES,研究者可以快速地对效应量的置信区间进行估计,使用BayesFactor,研究者可以使用贝叶斯因子来进行统计。其次,R语言能够加强心理学研究中数据分析的公开与透明的程度。与心理学中最常用的SPSS软件相比,R语言代码而非鼠标点击进行数据的预处理以及分析,能够精确地记录数据分析的过程。这对于将数据分析过程透明化具有重大意义。最近,合理使用Rmarkdown的强大功能,能够将数据处理与结果报告结合起来,能够让研究者完全地数据分析与论文撰写无缝结合,例如papaja工具包的出现,可以让研究者直接使用Rmarkdown完成APA格式的文稿写作。正是由于R语言的这些优势,在最近的重复研究中,R语言被广泛地使用。例如,2015,发表在Science上的大规模重复实验中,其数据分析用R完成。
心理学研究规范化及在R语言的实现
天津师范大学心理与行为研究院
硕士研究生:蔡培林
自2015年RPP项目的结果公布,表明其中的100项心理学研究中只有39项得到重复以来,心理学可重复性的危机已昭然若揭。不可重复背后主要涉及到各种不规范的研究操作,研究中使用的统计方法和出版偏见。为应对这种危机,新提出的TOP标准强调研究要提前注册,完整公开,开放数据与材料。运用R语言各种包和函数的强大功能,能有效增强心理学研究的规范化,促进研究的公开、透明和开放,从而提升研究的可重复性。
心理学在助老机器人研发中的应用
南京师范大学心理学院教授:余嘉元
当前70岁以上老年人存在不同程度的孤独感和抑郁感,影响了他们的心理健康水平。在研发助老机器人的过程中,我们采用隐马尔可夫模型和神经网络对老年人的语音进行分析,通过模糊模式识别方法对他们的孤独和抑郁程度进行评定。然后在事先构建的心理辅导知识库中提取相应的专家知识,对老年人进行个别化的干预,从而缓解其孤独感和抑郁感。
文本挖掘
新AI时代的智能问答
北京大学计算语言学研究所
所长:王厚峰
问答系统是人工智能和自然语言处理中广受关注的问题,是自动客服、人机会话、自动阅读理解、高级检索等应用中最核心的内容。随着新一轮人工智能热的兴起,自动问答更是受到了前所未有的重视,这不仅表现在学术界,而且也体现在工业界。然而,问答系统仍然存在大量尚待解决问题,包括问题的理解和答案的形成。报告简要介绍了新一轮人工智能的兴起过程及问答系统的发展状况,分析了问答系统中主要的难点以及我们在开展的相关研究工作。
自然语言处理中的统计结构学习
北京大学计算语言学研究所
副教授:孙薇薇
统计机器学习技术是自然语言处理的基石之一,和一般的应用场景相比,自然语言的一大特点是其句法语义的结构性,相应地结构化学习在自然语言处理中尤为重要。本报告主要讨论自然语言处理中的统计结构学习问题,从语言本体研究的角度介绍句法语义结构表征方式,从应用角度介绍这些结构和结构化学习之间的联系,并以图结构学习为重点介绍自然语言领域近几年的重点研究工作。
商业银行“半监督”文本聚类技术应用
中国民生银行公司业务管理部
数字化中心负责人:王彦博
在商业银行日常经营管理过程中,经常会产生大量非结构性文本数据。如何对这些文本数据进行分析挖掘,从中提炼出有价值的信息并加以有效应用,已经成为大数据时代商业银行需要解决的一项重要课题。通过构建“半监督”文本聚类技术,对文本主题、类别、关键词和样本之间的关系进行学习,从而实现对非结构性信息的结构化转换和提炼,相关应用对商业银行经营管理提升起到积极推动作用。
Bayesian Text Classification and Summarization via A Class-Specified Topic Model
北京大学光华管理学院
博士生:王菲菲
We propose the Class Specified Topic Model (CSTM), an extension of the Latent Dirichlet Allocation (LDA) model, to address the problems of text classification and summarization of texts within classes. We assume that each document has a probability distribution over a set of class-specific topics and a set of common topics shared across classes. Each class-specific or shared topic has its own probability distribution over a dictionary of words or phrases. Bayesian inference of the CSTM in semi-supervised scenario is developed, with supervised scenario as a special case. We analyze the 20 Newsgroup dataset, a benchmark dataset for text classification, and demonstrate that the CSTM has better performance in text classification and summarization than a two-stage approach based on LDA and a L1 penalized logistic regression.
统计模型在关键词提取、文本分类和
中文分词问题中的应用
北京大学光华管理学院
副教授:张俊妮
本报告主要讨论文本挖掘中的三个问题:提取关键词、文本分类以及分词。针对分类别的关键词提取问题,我们提出了基于假设检验的三种统计方法。针对文本分类问题,我们提出了一种将分类别的关键词引入主题模型的方法,DWTM(The Discriminative Words Topic Model)。我们接着提出了一种结合主题信息的分词模型WSTM(The Word Segmentation Topic Model),该模型能够同时进行分词并使用分类别的关键词进行分类。我们使用一些英文和中文数据集,比较了这些方法和现有的其他方法。
智能制造
大数据时代背景下设备安全管理与智能制造
郑州恩普特科技股份有限公司
服务中心总工程师:陈宏
1. 工业4.0与中国制造2025
2. 设备安全管理与智能制造
3. 当前存在的问题
4. 应对措施与解决方案
5. 未来的发展需求与展望
工业大数据的应用
深圳光启高等理工研究院
副院长:季春霖
本文主要介绍了统计方法和计算在新材料开发特别是超材料开发中的应用。在超材料开发中,利用统计学、信息学方法,通过数据挖掘探寻材料结构与性能之间的关系模式,缩短材料开发周期,降低开发成本。通过仿真与实验的有机结合,建立超材料基因数据库,结合物理学、人工智能、大数据、材料学,通过统计方法预测超材料的复杂电磁响应,实现新材料定制化。另外,介绍了统计方法在发动机设计诊断等工业问题中的应用。
数据智能实践--从互联网到传统行业
百度云计算事业部
首席数据科学家:沈志勇
行业的发展的需求,正从信息化,慢慢的转为数据驱动,最近开始追求智能化。随着各行业相继完成信息化进程,数据在各行业内逐渐形成积累,数据驱动的决策与业务优化的需求越来越明确,在某些数据驱动应用充分的行业,如金融,又在此基础上开始追求业务的智能化。互联网行业较早的经历和完成了从数据驱动到智能化的演化,在这里介绍一些相关的案例。
数控机床大数据分析
杭州数途科技信息有限公司研发部
创始人CEO:田野
节能减排是缓解工业能源消耗的主要途径,数途科技基于大数据技术,重点研究工业智能制造中的CNC数控机床智能生产。以精益生产为核心,对机床生产过程产生的实时数据开展分析。通过顶层设计,实现智能机床数据的云端整合。通过设计高维分布式大数据分析算法,实现智能机床生成的能量消耗实时预测。最终实现对工厂运行从排期到生成的全流程监控,全过程优化。以最低能耗实现产品精准化生产,真正达到工业生成的智能制造。该技术服务于数控机床零件加工企业,在冲压、注塑,过程制造,离散化生产线等领域都拥有巨大的应用场景。
特此通知:
目前第一阶段报名已截止,少数参会名额将于5月12日 20:00-24:00 开放,票务紧张,先报先得!
报名渠道请届时点击https://china-r-beijing2017.eventdove.com/,敬请期待!
统计之都:专业、人本、正直的中国统计学社区。
往期推送:进入统计之都会话窗口,点击右上角小人图标,查看历史消息即可。
本文 zblog模板 原创,转载保留链接!网址:https://wap.9you-home-0.com/post/46.html
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。
。 2017年,清华大学统计学研究中心、北京大学商务智能研究中心和统计之都携手共同主办第10届中国R会议。本届会议的主题包括医疗健康、生物信息、消费金融、量化投资、工业工程、智能制造、软件工具、计算平台、概率统计、机器学习、人工智能、自然语言、天文地理、城市规划、环境科学、社交网络、政务数据、商
2017年,是中国R会议值得纪念的第10个年头,本届R会议将于5月19-21日在美丽的清华大学举办。在这样一个值得纪念的时刻,让我们相聚清华大学统计学研究中心,相聚R会议十周年庆典,相聚这场数据与统计的盛宴!本届会议覆盖数据科学多个领域,我们
d summarization than a two-stage approach based on LDA and a L1 penalized logistic regression. 统计模型在关键