Li Xin report

存在问题

  • 通用性
  • 实效性
  • 可扩展性

网页特征 语义情感特征

  1. 主要创新
    模式 会话 图

  2. 非官方结果
    LC曲线。共线关系图

  3. 问答推广线下
    F1 值提升15% “答案-推广渠道”二部图

  4. 早检测 众包正理和未标注阳历学习LPU

创新点

  • 利用作弊者用于连接普通用户的作弊渠道
  • 早检测

论文

问答社区答案的低质量,推广信息,广告信息

  1. 评估答案是问答的质量
  2. 低质量不带广告
  3. 问题问答对和普通的很相似
  4. 答案级别的检测,问答对级别的检测
  5. 二部图的扩散算法 推广渠道上的扩散趋势,进行预测
  6. 基于两点假设,推广扩散图。
  7. 提问者的作弊分数,回答者分数,边的作弊权重。
  8. CDF的比较,加入不同种子推广渠道。
  9. LC曲线,AUC值来判断准确性
  10. ROC曲线

科研心得

多读

  • 作者的idea 比相关工作不同
  • 在某一段加上参考文献不会被argue

多写

多讨论