求解最高相似性
admin 发表于 2010-08-28 | 来源:互联网 | 阅读:
我手头有一个1750行 100列的excel数据表
单元格数据均以0或1填充
要求以1为条件
找出最相似的50行
我想知道做个程序去实现的复杂程度,及算法思路
我手头有一个1750行 100列的excel数据表
单元格数据均以0或1填充
要求以1为条件
找出最相似的50行
我想知道做个程序去实现的复杂程度,及算法思路
评论功能因故关闭!
请加入我们的QQ群一起参与讨论:群号59400482(500人超级群)
聚类算法。用matlab去做。
方法之一:统计各行的平均值和方差,以此为条件求出最相近的50行。
谢谢大家
还有一个问题就是如果连在一起,那么他们的相似度就要高一点你要考虑这个问题,呵呵比如:111111111111100000000001111110000011111110000010101010101001010101010
看看。。。。
聚类算法。用matlab去做。哥们也是搞机器学习的?? 我不知楼主这一百列的属性到底怎么样,以及他们的影响因子或者权重如何,如caozhy 所说,用聚类算法吧,按照你的50行相似,直接采用凝集算法,当某个集合达到50就停止输出。