Netflix的奖[我傻瓜]
在Netflix的奖是“显着改善(荷兰),约是多少人会喜欢他们的电影的喜好为基础的电影预测的准确性,”在公司自己的话来说是“追求”。
我看到今年2月的奖金就迈克尔计谋的博客的第一件事,我看到的是1元的赢家亿美元。 然而,尽管我们正在为了钱(是的!)我们没有的事我们该怎么得到它。 因此,让我们做手脚了!:
_For所有你都和我一样,业余或,再培训计划,我开始的地方显示赫克我的职位系列。
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...。
1)数据:在训练集(数据,您必须使用创建模型)是由超过1.7万的文本文件。 因此,尽管有些专家对Netflix的论坛 ,建议他们不要到组,我会做。
下面,像我自己的弱点和经济学家介意,我要去组在一个文件中的数据,以便转储到数据库(PostgreSQL的,它可能)。 更有什者,因为我没有时间去学习其他语言,我将使用Excel的VBA的。
在这里,我们去...
小组AgrupaDatos()
暗淡n作为双
暗淡TextoArchivo作为字符串开放的“C:\ training_set.txt对于为#1输出”
对于N = 1至17770
开放的“C:\ training_set \ mv_00”与格式(不适用,“00000”)&“。本文档对由于#2输入”你虽然不是民间文学(2)
线路输入#2,TextoArchivo
打印#1,TextoArchivo
环关闭#2
下一张张N
关闭#1
完子
该模块以上大约需要30分钟(奔腾1.73处理器,1GB内存),加工成一个有1,92 GB的文件中的数据。
下一步,该数据库。




































我不是很满意,所以我的代码重新做,以便更好的传输到数据库。
评论由弗朗西斯马可波罗,塞拉诺 - 2007年7月16日@ 上午12点05分