# COSCUP: 心理諮商與自然語言處理(NLP):文獻整理 ###### tags: `paper` `research` *我的想法* ## paper ### 1. Predicting Depression in Screening Interviews from Latent Categorization of Interview Prompts [原始論文](https://arxiv.org/abs/2106.01144) - 主要貢獻: - Joint Latent Prompt Categorization (JLPC) - 根據對話文字稿診斷憂鬱症 - 分析時考慮interviewer的prompt(將prompt分類) - 增加透明度 ### 2. Towards Emotional Support Dialog Systems [原始論文](https://aclanthology.org/2020.acl-main.2.pdf) - 主要貢獻 - 建構Emotion Support Conversation dataset (ESConv) - evaluate dialog models 在提供情感支持能力方面的表現 ### 3. D4 : a Chinese Dialogue Dataset for Depression-Diagnosis-Oriented Chat - 主要貢獻 - ## approach ### 1 paper - 將prompt分成多個latent categories,每個類別中的問題都會引起受訪者特定的回應模式。(category inferenve layer) - 這些分組是由模型自行學習得來的,因此這些組別不一定是人類直覺所能理解的,而是一些潛在的組別 - prompt -> 向量Pi -**Category Inference** Layer-> category membership vector hij = [h1ij, …,hKij] - $\overline{R} = \frac{1}{Z_i^k}\sum_{j=1}^{M_i}h_{ij}^k \times R_{ij}$ - group interview prompt and interview transcripts== into latent categories - 將 "interview prompt" 分成多個 "latent categories",再和response 一起丟進model - model: CNN for 分類(embedding layer + convolutional layer + max-pooling layer + softmax layer) - embedding: 將文本序列轉換為向量表示 - convolutional: 捕捉文本中的局部特徵來提取有用的信息 - max-pooling: 將卷積結果中的最重要特徵提取出來 - softmax: 分類概率的計算 ### 2 paper - 提出階段和策略選擇的方法 ## dataset ### 1 paper - Distress Analysis Interview Corpus (DAIC) - consul transcript - *提問者問的問題都太制式,和真正的諮商有差* ## paper 2 - Emotion Support Conversation dataset (ESConv) - 有很多標籤 - 情緒強度、對話參與者的共情程度、對話內容的相關性以及最終情緒強度 - 每個對話 - 策略(supporter), feedback(seeker) ## evaluation ### 1 paper - 診斷命中率 F1 - 比較對象Bert - 評估關於憂鬱症的特定類別的心理語言學假設(對於特定主題的回應) - 社交技能缺陷 - response length - 沉默的基本雕準 - 對於starter 類別,回答短且低意義的詞 - 開場發言類別中憂鬱的信號詞更能反映我們對假設H1的發現:模型著重於短小、低語義內容的詞語,這可能表明社交技能的不足 - usage of fillers and discourse markers - 繪畫技術技能的衡量標準 - 因為演講者會用這些術語來管理會話(有paper佐證) <!-- paper: Jean E. Fox Tree. 2010. Discourse Markers across Speakers and Settings. Language and Linguistics Compass, 4(5):269–281. --> -$\over R_i$憂鬱最強(正向)信號的詞語 - 他有多和depression相關 = 詞向量憂鬱相關主題之間的相似性 ## paper 2 - 把它生成的對話和dataset的資料去做比對 - perplexity (PPL), BLEU-2 (B2), ROUGE-L (R-L), and the BOW Embedding-based Extrema matching score ## paper 3 - 衡量模型生成的回應與標籤之間的相似度