我是本科生,要做spark平台下的数据挖掘研究,老师说可以是文本数据,网络文本什么的,也可以是图像,这个实验室有数据,就是医学方面的图像。最终可能是电子病历。我也查了一些论文,但发现他们都有医院方面来的数据。
我想问一下,文本数据和图像数据方面难度差别会不会很大?网络文本怎么样?