ภาควิชาวิศวกรรมอุตสาหการ คณะวิศวฯ จุฬาฯ ร่วมกับ มหาวิทยาลัยโตเกียว เปิดรับสมัครโครงการอบรมฟรี Text Mining by Using Python: Application to Patent Documents

ภาควิชาวิศวกรรมอุตสาหการ คณะวิศวกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย ร่วมกับ มหาวิทยาลัยโตเกียว เปิดรับสมัครโครงการอบรมฟรี Text Mining by Using Python: Application to Patent Documents โดยวิทยากรผู้เชี่ยวชาญ ศาสตราจารย์ ดร.Kazuyuki Motohashi (มหาวิทยาลัยโตเกียว ประเทศญี่ปุ่น) และผู้ช่วยสอน ดร.สุจิต พงษ์นุ่มกุล

อบรม 3 วัน: 27, 29, และ 31 พฤษภาคม 2562
เวลา: 9.00-12.00 น.
สถานที่อบรม: ห้อง 407 ชั้น 4 อาคารเจริญวิศวกรรม (ตึก 4) คณะวิศวกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย

ค่าอบรม: ฟรี!!
คุณสมบัติผู้สมัคร: นิสิตคณะวิศวกรรมศาสตร์ ไม่จำกัดสาขา ระดับการศึกษาและชั้นปี
ความรู้เบื้องต้น: ผู้เข้าอบรมจะต้องศึกษาวิดีโอตามที่แนะนำก่อนถ้าไม่มีพื้นฐาน Python
ภาษาที่ใช้ในการอบรม: ภาษาอังกฤษ (และภาษาไทยโดยผู้ช่วยสอน)

เนื้อหาการอบรมประกอบด้วย
– Introduction to patent data analysis
λ What is patent data? Why is it used for technology management research?
λ Various kinds of patent database: PATSTAT, JPO (IIP patent database), USPTO
λ Keyword extraction, TF-IDF, similarity measures
λ VIDEO (O’Reilly Media) https://www.oreilly.com/learning/how-do-i-compare-document-similarity-using-python
λ HOMEWORK: Apply patent abstract documents to the Video exercise above, and extract three keywords by using TF-IDF scores

– Patent Similarity
λ Review of homework
λ Preprocessing of text: tokenization regularization (lowering character), stemming/lemmatization and stop words exclusion
λ Text processing of tf-idf vectors:
① Create dictionary: mapping every word to a number
② Corpus (list of bags of words) : a list of number of words occurring in each documents
λ Calculation of similarity measures across each documents : genism.similarities

– Topic Modeling
λ What is topic modeling (with some examples)
① Understanding the concept: LDA
λ Gensim module in Python Topic modeling works for the following three technologies, comparison with JPO classification
① Artificial intelligence
② Autonomous driving
③ Gene modification technology
λ Good reference about topic modeling by genism https://www.machinelearningplus.com/nlp/topic-modeling-gensim-python/
λ Assignment for further works (three weeks program)

ผู้ที่สนใจสามารถลงทะเบียนได้ตั้งแต่วันนี้ถึงวันที่ 18 พฤษภาคม 2562 ทาง https://forms.gle/mPYfDKYx8VmR8jQM8
ด่วน รับสมัครเพียง 20 คน เท่านั้น

ข้อมูลเพิ่มเติม กรุณาติดต่อผู้ประสานงานโครงการ อาจารย์ ดร.ณัฏฐ์ ลีละวัฒน์ (natt.l@chula.ac.th) ภาควิชาวิศวกรรมอุตสาหการ คณะวิศวกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย และกลุ่มวิจัยระบบสารสนเทศการจัดการความเสี่ยงและภัยพิบัติ จุฬาลงกรณ์มหาวิทยาลัย