字体为什么会缺字?

2024-05-16 00:00:00.0

分類: 字体产品与应用

使用字体碰到缺字的原因有很多,最主要原因是字体使用的字集,其次与输入法有关。

繁体中文在开发时最常使用的字体规格为Big5-2003(大五码),共收录13,060个汉字。 有1万多汉字怎么还会缺字? 原因是有些一般生活常用字并没有收录在其中,像是尘螨的「螨」、擀面的「擀」等文字。 因此形成使用Big5字集开发的字体在编排文件出现缺字的情形。 

为了降低用户用字缺字的机率,文鼎字型以现有Big5-2003字集规格为基础,参考教育部字频总表、中研院现代汉语语料库词频统计、网络流行用字以及营销与客户服务所累积的信息,汇整389个汉字,整合成Big5_AR 2021规格,自2021年以后皆以此规格进行新字体产品的开发,早期热销、经典的字体亦规划补字更新,用户可以透过iFontCloud获得最新版本的字体使用。 

再来谈到输入法。
可以打出汉字的中文输入法有很多种,每种输入法形成汉字的方式不大相同,一般常见为注音输入法和汉语拼音输入法。



如果不是使用注音输入法或汉语拼音输入法,有些字符的汉字与部首外型长得一样,但是实际上分属于不同的Unicode码位,就会形成透过输入法显示出来的文字误植成部首字也浑然不知, 误以为是字体缺字。 以字符「日」为例,「日」汉字的Unicode码位是U+65E5,是定义在中日韩统一表意文字(CJK Unified Ideographs)中,另外有一个与其形状几乎一样的「日」,是位于康熙部首字区( Kangxi Radicals)的部首字,它的Unicode码为是U+2F47,U+2F47其为Unicode于Unicode 3.0根据康熙字典的214个部首按序编排,位于U+2F00 - U+2FD5当中的一个字符。 此区段的字符是用于表示部首使用,不是中日韩统一表意文字区段内的汉字,而繁体中文使用的Big5-2003的规格并没有完整收录这些部首字的字符,在这样的情况下,如果使用标准Big5-2003字集的字体, 在输入U+65E5国字的「日」能够显示套用的字体,但是打成U+2F47部首字的「日」则可能会显示缺字的状况。

下次碰到字体缺字的状况别惊慌,先确认字符是否为汉字以及字体使用的字集就能解决大部分的问题啰!


字体产品与应用

字体风味轮

文鼎是一家字型厂商,近几年也陆续承接了许多字型配对的案件,主要都由英欧文字的需求开始,做中文、日文、韩文的字体搭配。以我们所处的环境,每天眼睛看到的繁体中文,对我们来说是最熟悉不过的文字,但是,对于文字来说,透过笔画造型、字体结构等变量因子的设计,会产生许多不同风格的字体产品出来,茫茫字海中有没有什么方式可以让使用者快速的找到所需使用的字体呢?|

喜欢喝咖啡或常逛咖啡馆的同好如果有注意到的话,应该会知道「咖啡风味轮(Coffee Taster's Flavor Wheel)」,它时常以海报的形式挂在咖啡馆中展示,如果没有看过,有机会的话多走几间咖啡馆,留意一下墙面的海报,就会发现啰!我们参考咖啡风味轮的概念,将其延伸到字体来,以汉字为出发点,从以字型应用的角度,试图将抽象的感受具体呈现出来,用图像形式设计出一个具有感性、具有情感的字体分类系统,让用户需要以感受来选字时,可以透过文字风味轮找到对应的字体,减少找字体、选字体的时间。

感受这种东西是一种主观性的认知,为了尽量找出符合大众想法的感受,在绘制字体风味轮之前,研究团队做了以下前期研究:

1. 研究咖啡风味轮期发展过程,是否有可借镜之处?

2. 以人为单位,不同的个体对字体造型是否有共通感受?

3. 字体造型是否受到文化发展的影响

4. 越来越多的跨语系字型Matching,风味轮/个性轮的定义,是否对此有帮助?及智能显示的应用?

 

我们认为感受性的事物会因为人、事、时、地、物等因素而有不同,因此我们也藉由公开的投票系统,让参与者参加文字风味轮分类的统计,让文字风味轮不仅是一个图像,而是能呼应外界的变化具有生命力的模型。

 

最后,整合我们所收集到的数据,将这些数据整合到字体的数据库,让每个字体都有自己的标签分类形成字体风味轮。

 

文鼎字体风味轮档案下载

 

字体产品与应用

长体

长久以来,大多数中文汉字数字字体的设计规格都局限在正方形的方框中,从而产品化出结构方正的字体,然而,当遇到字符宽度无法在有限的宽度空间中做文字排版时,即延伸出「长体」的字体产品,用以缩减排版时整体的字符宽度。早期长体的设计,相对于正方形标准产品的设计规格,保持相同的字体高度,但缩小左右的水平空间,所形成长型的字体即称为长体,相对于未变形前水平、垂直100%的比例,缩小左右10%比例的字体,称为长一,缩小左右20%比例的字体,称为长二…。

为什么要使用长体字?
长体数字中文字型的数量相对来的少,在早期,由于软、硬件环境的不成熟,长体字被设计在正方形的方框中,缩小后的左右水平空间以留白的样貌呈现,在水平横向排排版应用时,会形成字符间距过大的情况。随着外部软硬件技术的提升,新技术、新应用情境的发生,字体设计的弹性更加的广泛,让字体设计师的创意可以尽情的发挥。

如前述,规格上,长体是缩小左右比例后的字型产品,在应用上存在经济效益,此经济效益说明的是节省版面的空间,具有较窄字宽的长体字,能够将更多的字符呈现在一行、标题、段落、区块文字甚至是页面中,具有在有限的排版空间上呈现较多字符数的特性,反之,在同样的版面空间上,可以有较多的字符数来呈现内容。 但是,长体字也不是没有缺点,毕竟在汉字,尤其是笔画数多的汉字,在缩小字宽后的辨视度、易读性会比标准字宽的字体来的低。


中文长体字的使用在直排、字符数少的情境下效果最佳,以字符数少的情境,当字体家族具有标准与长体字的设计时,如标题、引言等都是长体适合发挥的舞台。使用同一种字体风格的长体字做排版,除了可以凸显要点外,还可以维持整体风格的一致性;当长体字被独立使用时,其长形字的特色容易被凸显出来,用在独立的标题更显特色。



长体字型产品的开发,丰富且扩展了字体家族。
中文字型产品的字体家族(font family)大多以字重的粗细为基础做字型产品的开发,相对于拉丁字的字体家族设计,除了字重以外,还有斜体(italic)、长体/窄体(condensed/ narrow)、宽体(extended)等设计,对应上就显的单薄。在应用上,若设计案件选择到具有condensed/ narrow设计的拉丁字,这时,往往找不到合适的中文字型产品做匹配。



自2017年开始,文鼎字型着手设计并发行具有规格化的长体字型产品,在字型设计时,即考虑使用行为,为了让设计师/用户快速的从软件的字型列表中找到长体字型,我们在字体名称上做区隔,透过代码即可辨视该字型是否为长体字。长体字型以代码C做为表示,代码后的数字表示在EM1000的规格下,字宽的比例,如「C80」表示为长体、字宽80%的字型。



目前,文鼎字型具有长体设计的字体家族有:文鼎UD晶熙黑體E1、文鼎方新書、文鼎書苑宋、文鼎白玉書體,详细如下:(Variable Font:表示变量轴支持长体的变化)

字型名稱 字重 標準 C95 C90 C80 Variable Font
文鼎UD晶熙黑體 E1 MD
DB
BD
EB
HV
文鼎方新書 H7 MD
DB
BD
EB
HV
文鼎書苑宋 HKH32
文鼎書苑宋 HKH46
MD
DB
BD
EB
HV
文鼎白玉書體 H16 LT
MD
DB
BD
EB
HV
EH
DBL
BL
文鼎白玉書體 H32 MD
DB
BD

*○:可透过可变式字型(Variable Font)使用

长体字型产品图例: