中国科学院自动化研究所   设为首页   加入收藏  联系我们
 
English
网站首页     实验室概况     研究队伍     组织机构     学术交流     科研成果     人才培养     开放课题     创新文化     资源共享     联系我们
    学术讲座

2011年10月18日:模式识别系列讲座

模式识别系列讲座

Lecture Series in Pattern Recognition

 

题    目(TITLE):Methods and corpora
讲 座 人(SPEAKER):André Salem, University Paris 3 Sorbonne Nouvelle
主 持 人 (CHAIR):Prof. Chengqing Zong
时    间 (TIME):9:00AM, October 18 (Tuesday)
地    点 (VENUE):1115 Meeting Room, 11th Floor

 

报告摘要ABSTRACT):

Researchers in a number of disciplines deal with large text sets requiring both text management and text analysis. Faced with a big amount of textual data collected in marketing surveys, literary investigations, historical archives and documentary data bases, these researchers require assistance with organizing, describing and comparing texts. Textometry combines a set of multivariate statistical methods such as correspondence analysis and cluster analysis. It can be used to investigate, assimilate and evaluate textual data. A succession of textometric applications to text corpora, written in various languages (English, French, Chinese, etc.), will allow us to appreciate the variety of actual and potential applications and the complementary processing methods.

报告人简介(BIOGRAPHY)

SALEM André

13 décembre 1946,  Oran (Algérie)

professeur émérite. en Sciences du langage (7e section)

Université de la Sorbonne nouvelle - Paris 3

17 rue de la Sorbonne, 75005 Paris

 

1993                   Thèse d'état en sciences du langage : Méthodes de la statistique textuelle, Université de la Sorbonne nouvelle - Paris 3.

1979                   Thèse de 3ème cycle en statistiques mathématiques : Contribution à une méthodologie de la validation en analyse des données textuelles, sous la direction de D. Dugué et J.-P. Benzécri, mention très honorable, Université Pierre et Marie Curie - Paris 6.

1964-1970          Master of science of mathematics (probabilities), Moscow State University, Faculty of Mechanics and Mathematics, Moscow, Lomonossov - Moscow (USSR).

Main publications

SALEM André, Pratique des segments répétés, Publications de l'INaLF, collection "St.Cloud", Paris, Klincksieck, 1987, 333 p.

LEBART Ludovic, SALEM André, Analyse statistique des données textuelles. Questions ouvertes et lexicométrie, Paris, Dunod, 1988, 210 p.

[LEBART Ludovic, SALEM André, Statistique textuelle, Paris, Dunod, 1994, 342 p

          http://www.springer.com/statistics/book/978-0-7923-4840-5

HABERT Benoît, NAZARENKO Adeline, SALEM André, Les linguistiques de corpus, Paris, Armand Colin, 1997, 240 p.

LEBART Ludovic, SALEM André, BERRY Lisette, Exploring Textual Data, (adaptation anglaise largement actualisée de l'ouvrage Statistique Textuelle [3]), Boston, Kluwer academic publishers, 1997, 222 p.

 

 

承办单位:模式识别国家重点实验室   
友情链接
 
中科院自动化研究所 模式识别国家重点实验室 事业单位  京ICP备14019135号-3
NLPR, INSTITUTE OF AUTOMATION, CHINESE ACADEMY OF SCIENCES