Netflix的奖[我傻瓜]

张贴在Netflix公司 ,VBA中数据库业务由Francisco马可波罗@ 2007年5月3日塞拉诺研究

Netflix的奖是“显着改善(荷兰),约是多少人会喜欢他们的电影的喜好为基础的电影预测的准确性,”在公司自己的话来说是“追求”。

我看到今年2月的奖金就迈克尔计谋的博客的第一件事,我看到的是1元的赢家亿美元。 然而,尽管我们正在为了钱(是的!)我们没有的事我们该怎么得到它。 因此,让我们做手脚了!:

_For所有你都和我一样,业余或,再培训计划,我开始的地方显示赫克我的职位系列。

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...。

1)数据:在训练集(数据,您必须使用创建模型)是由超过1.7万的文本文件。 因此,尽管有些专家对Netflix的论坛 ,建议他们不要到组,我会做。

下面,像我自己的弱点和经济学家介意,我要去组在一个文件中的数据,以便转储到数据库(PostgreSQL的,它可能)。 更有什者,因为我没有时间去学习其他语言,我将使用Excel的VBA的。

在这里,我们去...

小组AgrupaDatos()

暗淡n作为双
暗淡TextoArchivo作为字符串

开放的“C:\ training_set.txt对于为#1输出”

对于N = 1至17770
开放的“C:\ training_set \ mv_00”与格式(不适用,“00000”)&“。本文档对由于#2输入”

你虽然不是民间文学(2)
线路输入#2,TextoArchivo
打印#1,TextoArchivo

关闭#2

下一张张N

关闭#1

完子

该模块以上大约需要30分钟(奔腾1.73处理器,1GB内存),加工成一个有1,92 GB的文件中的数据。

下一步,该数据库。

1条评论

  1. 我不是很满意,所以我的代码重新做,以便更好的传输到数据库。

    评论由弗朗西斯马可波罗,塞拉诺 - 2007年7月16日@ 上午12点05分

RSS饲料的评论对这个职位。

对不起,评论的形式是封闭在这个时候。