杠一下。
iOS上有一个手写的计算器。MyScript Calculator。 https://apps.apple.com/us/app/myscript-calculator/id1304488725 README.md,要不要改一下。
myscript的确牛逼,据说是法国公司,他会收集每个国家的文字作为数据集。
个人感觉实现了OCR识别表达式之后就转化成了数学计算,而数学计算有matlab、wolfram alpha这些工具,如果能够调用他们的api(如果有的话),问题就转化成了OCR符号识别。
另外一点,因为这个问题对识别结果要求很高,建议在识别的结果上加上可以人工修正识别结果的环节,ios上有一个app叫Mathkey,就是能够实现将图片转化为Latex格式的公式,而且可以人工修正;自动识别后只需要少量修改就能够不产生错误了。
博主最后说的想法有点符号主义的感觉?有点难以理解。
博主加油!
个人感觉实现了OCR识别表达式之后就转化成了数学计算,而数学计算有matlab、wolfram alpha这些工具,如果能够调用他们的api(如果有的话),问题就转化成了OCR符号识别。
另外一点,因为这个问题对识别结果要求很高,建议在识别的结果上加上可以人工修正识别结果的环节,ios上有一个app叫Mathkey,就是能够实现将图片转化为Latex格式的公式,而且可以人工修正;自动识别后只需要少量修改就能够不产生错误了。
博主最后说的想法有点符号主义的感觉?有点难以理解。
博主加油!
的确,识别是目前主要的挑战。人工修改环节在某些应用场景可以考虑,在另外的应用场景可能就不能人工修改。
关于后面的想法,我想表达的是,其实文字、语言以及图像目标对象只不过是人类创造的认识世界的标记。现在大部分工作是去把文字、语言、目标识别出来,下一步就要去像人一样去理解它(让机器与人共享同一个世界观)。