DAY 2

09:48:25

从一个无知角落里开始,蹒跚学步,一个未知到另一个未知,在跌跌撞撞中越走越快,越走越远,最后宇宙也为之开源。对于探索者来说,最后他们的思想总是变得和自己的足迹一样伟大。

 该项目目前可以实现

  • 图像的预处理包括:灰度化,二值化(公式假设是良好的数学公式截屏图片)
  • 图像的最小外接矩求解;
  • 图像的切割(part)

2021-05-02 20:24:30

  Cut_Imageju:实现最小外接矩

%%实现最小外接矩的函数Cut_Imageju
%column的意思是按列来排列,为行向量
%row的意思是按行来排列,为列向量
%0黑1白,字符以黑色为显示
%寻找第一个字母长度,先分割出来全部字符,之后在对分割的这些部分进行宽度处理,要不处理不了;
function Img_out=Cut_Imageju(Img_in)
[m,n]=size(Img_in);% x是行数,y是列数
column=sum(Img_in);
%寻找左边界
left=1;
num1=max(column);
for i = 1 :n
	if column(i)~=num1
		left=i;
		break
end
end
%寻找右边界
right=n;
for i = n :-1:1
	if column(i)~=num1
		right=i;
		break
end
end
row=sum(Img_in,2);
num2=max(row);
%寻找上边界
up=1;
for j = 1 :m
	if row(j)~=num2
		up=j;
		break
end
end
%寻找下边界
down=m;
for j = m:-1:1
	if row(j)~=num2
		down=j;
		break
end
end
%裁剪图像
Img_out=Img_in(up:down,left:right);
end

  

Cut_Imageqie:切割字符,并且获得切割后的源量
%切分字符的函数Cut_Imageqie
%只按列切割,切成一列列
%column的意思是按列来排列,为行向量
%row的意思是按行来排列,为列向量
%0黑1白,字符以黑色为显示
%寻找第一个字母长度,先分割出来全部字符,之后在对分割的这些部分进行宽度处理,要不处理不了;
%切分字符的函数Cut_Imageqie
%只按列切割,切成一列列
%%[Img_out1,Img_out2]分别代表切割下的图像和切割后的原图像
function [Img_out1,Img_out2]=Cut_Imageqie(Img_in)
[m,n]=size(Img_in);
column=sum(Img_in);
wide=0;
num1=max(column);
for i = 1:n
	if column(i)~=num1
		wide=wide+1;
	else
		newleft=i;
		break
end
end
Img_out1=imcrop(Img_in,[1,1,wide,m]);
Img_out2=Img_in(1:m,newleft:n);
end

  总函数

%%垂直投影切割函数2
%%将之前函数片段化函数化,实现从原图像中分割字符
%%王 5/2 16点18分

%清屏
clc;
close all;
clear all;

%读数
Img=imread('D:\data\matlabrecognizedata\rawpicture\pic2.png');%按实际路径分析
figure,subplot(1,2,1),imshow(Img),title('原图');

%灰度化和二值化
Img_Gray=rgb2gray(Img);
Img_Binary=imbinarize(Img_Gray,0.57);%采用0.57做阈值;

%求外接矩
Img_Cut=Cut_Imageju(Img_Binary);
subplot(1,2,2),imshow(Img_Cut),title('外接矩');

%分割图像
[word1,Img_Cut]=Cut_Imageqie(Img_Cut);
figure,subplot(1,3,1),imshow(word1),title('初次切');
subplot(1,3,2),imshow(Img_Cut),title('切后的原图形');
word1=Cut_Imageju(word1);
subplot(1,3,3),imshow(word1),title('后切');

  该项目还不能实现

  • 图像的切割太过于依靠手动操作,并不能自动分析间隔,没有可以使他自动停止的标准
  • 只局限于字母和单独的式子,主要是因为采取了垂直投影分割法,识别的东西一定是独体,但是像分数,根号或者其他字符的组合,就失败了,后期会考虑连通域算法;
  • 不能实现识别;

 

严肃的东西说完了,下面说点有意思的;

1、数字图像处理的过程中,发生了很多有趣的事。一步步的攻克这些难关挺快乐的,但是千辛万苦克服之后发现这些问题那么简单,却难住了我,做出来的一瞬间,觉得自己的智慧受到了侮辱,哈哈😢;由此可见,困难来自于无知

2、数学是严谨的,代码是数学的分支。你看我现在说的轻描淡写,可是这之中的难处只有我自己知道

  • 初心太单纯(兴趣),导致唯利是图的我经常怀疑自己的判断(这么浪费时间到底对不对?)我可能烧了脑袋
  • 基础知识基本为0,matlab是伟大的,我毫不怀疑,它是人类智慧的结晶,我看着他仿佛看着海,那么大,那么远,那么不真实,数字图像处理是这无边大海的一个大洋,我对这大洋一无所知,就现在的我来说刚从港湾出来,没有经历过复杂的公式考验,没有经历过神经网络的建立,没有建立机器学习模型,没有爬取足够我使用的数据图片,而没有这些图片就没有人工智能(神经网络)。我边在海滩拾贝,边想着把梳子卖给和尚,三心二意,貌合神离。
  • 不严谨。拖累我进度的一方面是思路,一方面是细节。后者占90%,我一直在debug,一个看起来完全没问题的程序完全走不通,看着几页的代码,真的是想放弃,最后发现是一些极其极其简单的问题摧毁了我(比如[]和()(又错了😔),()和(),;和;等等等等)。
  • 函数嵌套要我命

我又会停几天了

乘兴而来,兴尽而返

enough,挺快乐的了。

祝劳动者劳动节快乐!!

探索者光荣!!