手机浏览器扫描二维码访问
一秒记住【m.xiaoyanwenxue.cc】精彩无弹窗免费!
“重生学神有系统(.shg.tw)”
!
不过,在跑代码之前,还要对数据进行预处理。
江寒先从报名信息表中,将性别信息仍然“健在”
的行挑出来,只保留序号、姓名和性别,另存为label.xls。
这些记录一共9527条,大约占三万多条数据总数的30%。
它们对应着9527张真彩色照片。
24位真彩色的图片,每个像素点在内存里,要占用3个字节的存储单元。
每张照片有210×120个像素,这样读入一张照片,需要的内存空间就是210×120×3=75600个Byte。
9527条数据,共需要9527×75600=720241200B≈686.88M≈0.7G!
这个内存开销,还是比较容易接受的。
但是,“感知机”
的算法,需要进行大量浮点乘法运算。
对每个像素的每个RGB分量都算一遍?
没那个必要,也太浪费时间。
所以,聪明的做法,是先把照片数据“压缩”
一下。
江寒给“感知机”
的代码,添加了一个LoadData函数,用来读取和处理照片数据。
在这个函数里,先定义一个二维的整形数组Feature。
然后从label.xls中读出序号、姓名信息,按照刚才建立的索引表,找到对应的照片文件。
下一步,将照片读取到内存中,读取的同时,将每个像素二值化。
具体做法是:色彩浓度在阈值以上的像素,取值为1,低于阈值就让它为0。
这样一来,原本的真彩色照片,就被转换成了黑白轮廓图。
然后,再将轮廓图中的0或者1的取值,按照从左到右、从上到下的顺序,重新编排成一行数据,存放到数组Feature中。
Feature中的每一行,都存储了一张照片的二值化信息。
一共9527张照片,就需要9527行。
全部照片处理完毕后,就得到了一个巨大的二维数组Feature。
它有25200列、9527行。
接下来,定义一个拥有9527个整形元素的一维数组Label。
从label.xls中读入性别信息,男生设为1,女生设为0,存放在数组Label中。
Feature加上对应的Label,就构成了训练数据集。
训练“感知机”
时,将一行行Feature代入公式中,进行加权和运算,其结果再通过sign函数,转换为0或1,然后和对应的Label值对照。
如果不相符,就调整权重和偏置,然后重新计算。
当每一个Feature代入公式后,都能计算出正确的Label时,就得到了一组权重和偏置。
也就是说,构建出了一个可用的数学模型。
依据这个模型,计算机就可以读入任何一张同尺寸、类型的照片,对其二值化的数据代入模型中运算,并根据运算结果判断分类归属。
重生在内向自卑的新壳子里,看她如何一步步蜕变破茧成蝶!随身空间在手,珍贵药材遍地有。洗筋伐髓一走,打遍天下无敌手。神秘医术我有,白骨生肉下九幽。她不就是顺手救了他么?高高在上的帝王怎么就甘愿洗手作羹汤?不约!我们不约!...
豪门弃少龙隐都市,都以为他是个废物,万人唾弃。当他不再隐忍时,风云剧变,所有瞧不起他的人,无不匍匐在他面前舔脚尖...
关于叛逆的征途他意外的被神秘组织看中,从此夏文杰的人生,发生了彪悍的改变!在最凶残的雷锋训练营中锻炼强大的体魄,进神秘的警校开始虎胆龙威的人生!黑道败类,都小心了!...
二十三世纪天才科学家重生了,他用一项项科技改变世界,他拥有无数的荣誉,他俯视爱因斯坦,他拥有数之不尽的财富,他每天被无数美女诱惑包围。用科技征服全球,用经济殖民全世界。让全世界的人,为中国人打工,让中华民族屹立世界巅峰。在这个落后的地球上,我无所不能。求收藏,求推荐票支持。...
命运的摆布促使孤独一方,然而孤独的命运并未就此妥协,两条不同的道为他们而趟开,在无父无母的孕育和帮助下,不妥协的心促使他们一步一步成长,天赋也注定他们命运紧紧相连,爱恨情仇正邪两义伴随于各自的坎坷道上。...
十大基因链大师,狂人乔无法因为争夺永恒星核,以求凝炼小宇宙,意外身毁。俯身在军部闲职将军的纨绔儿子身上,化身乔无天,开启了一段嚣张,霸道,暴力,专打装逼货的无法无天之旅。力量基因链,力大无穷!燃烧基因链,焚尽天下!闪电基因链,雷霆无穷!然而,这一切的基因链,必须有基因链师,才可以配置!全星际,十大基因链大师之中的狂人乔无法,便是此道强者中的强者!...