LVTagger icon indicating copy to clipboard operation
LVTagger copied to clipboard

Whitespace preservation

Open aznotins opened this issue 5 months ago • 2 comments

There are still problematic cases with white space preservation in the output.

  • valoda (LAT1)
  • un „vislabāk pārvaldītā valoda”
morphotagger.sh -vert -whitespace-marker << EOF
(LAT1)
valoda (LAT1)
„vislabāk pārvaldītā valoda”
un „vislabāk pārvaldītā valoda”
EOF
(	zb	(
<g />
LAT1	xx	Lat1
<g />
)	zb	)

valoda	ncfsn4	valoda
(	zb	(
LAT1	xx	Lat1
<g />
)	zb	)

„	zq	"
<g />
vislabāk	rsn	labi
pārvaldītā	vmnpdfsnpsypn	pārvaldīt
valoda	ncfsn4	valoda
<g />
”	zq	"

un	cc	un
„	zq	"
vislabāk	rsn	labi
pārvaldītā	vmnpdfsnpsypn	pārvaldīt
valoda	ncfsn4	valoda
<g />
”	zq	"

@viestursjl

aznotins avatar Sep 19 '24 11:09 aznotins