检查方案的自动优化的制作方法

1.当前公开的主题总体上涉及样本检查领域，并且更具体地涉及检查方案的优化。

背景技术：

2.当前对与所制造器件的超大规模集成相关联的高密度和性能的需求需要亚微米特征、增加的晶体管和电路速度、以及改善的可靠性。随着半导体工艺进展，诸如线宽之类的图案尺寸和其他类型的关键尺寸持续收缩。这类需求需要形成具有高精度和均匀性的器件特征，这继而有必要小心监控制造工艺，包括在器件仍处于半导体晶片的形式时自动检查器件。
3.作为非限制性示例，运行时检查可以采用两阶段过程，例如，检验样本接着审查潜在缺陷的取样位置。检查总体上涉及通过将光或电子引导至晶片并检测来自晶片的光或电子来产生针对样本的某个输出(例如，图像、信号等)。在第一阶段期间，以高速和相对低的分辨率检验样本的表面。缺陷检测通常通过将缺陷检测算法应用于检验输出来执行。产生缺陷图以示出具有高缺陷概率的样本上的可疑位置。最经常地，检验的目的是提供对检测感兴趣的缺陷的高敏感度，同时抑制对晶片上噪扰(nuisance)和噪声的检测。在第二阶段期间，以相对高的分辨率更透彻地分析可疑位置中的至少一些可疑位置。在一些情况下，两个阶段都可以由相同检验工具来实现，并且在一些其他情况下，这两个阶段由不同的检验工具来实现。
4.检查工艺可以包括多个检查步骤。在制造工艺期间，例如，在制造或处理某些层之后等，检查步骤可以执行多次。附加地或替代地，例如针对不同的晶片位置或针对具有不同检查设置的相同晶片位置，每个检查步骤可以重复多次。
5.检查工艺在半导体制造期间的各个步骤处使用来检测和分类样本上的缺陷、以及执行计量相关的操作。检查的有效性可以通过(多个)工艺的自动化来提高，所述(多个)工艺例如，缺陷检测、自动缺陷分类(adc)、自动缺陷审查(adr)、图像分割、自动的计量相关的操作等。

技术实现要素：

6.根据当前公开的主题的某些方面，提供了一种可用于检查半导体样本的检查方案的自动优化的计算机化系统，所述系统包括：存储单元，所述存储单元经配置为存储：i)一个或多个检验图像，每个检验图像表示半导体样本的至少一部分，一个或多个检验图像指示使用包括在检查方案中的第一分类器从缺陷图中选择的相应缺陷候选；ii)标签数据，所述标签数据分别与一个或多个检验图像相关联并且提供相应缺陷候选的类型的信息；以及处理和存储器电路系统(pmc)，所述处理和存储器电路系统(pmc)操作地连接到存储单元并且被配置为：提取表征一个或多个检验图像的检验特征；使用检验特征和标签数据重新训练第一分类器，从而产生第二分类器；以及通过用第二分类器替换第一分类器来优化检查方案；其中经优化的检查方案可用于检查后续的半导体样本。
7.除了以上特征之外，根据当前公开的主题的这个方面的系统可以包括以技术上可能的任何期望组合或排列的下文列出的特征(i)至(xiv)中的一个或多个：
8.(i).缺陷图可以由检验工具生成并且可指示半导体样本上的缺陷候选分布。
9.(ii).标签数据可以由审查工具生成，包括：在相应缺陷候选的位置处捕获一个或多个审查图像，并且审查一个或多个审查图像以获得与其相关联的标签数据。
10.(iii).相应缺陷候选的类型中的每一者指示以下各项中的至少一项：感兴趣的缺陷(doi)、噪扰和相应缺陷候选的类别。
11.(iv).检验特征包括由使用一组训练检验图像预先训练以提取所述一组训练检验图像的代表性特征的无监督模型提取的第一特征。
12.(v).第一分类器使用具有相应关联的标签数据的一组训练检验图像中的一个或多个训练检验图像来预先训练。
13.(vi).检验特征可以进一步包括由监督模型提取的第二特征，所述监督模型使用具有相应关联的标签数据的一组训练检验图像中的一个或多个训练检验图像来预先训练以确定缺陷候选的类型。
14.(vii).第二特征包括以下各项中的至少一项：i)表征一个或多个检验图像的特征向量，以及ii)指示检验图像上的每个给定缺陷候选属于特定类型的概率的标签预测特征。
15.(viii).pmc可以经配置为除了检验特征和标签数据之外，还使用包括以下各项中的至少一项的第三特征来重新训练第一分类器：工具特征、缺陷特征和样本特征。
16.(ix).pmc可以进一步经配置为在重新训练第一分类器之前使用一个或多个检验图像和标签数据来重新训练无监督模型和/或监督模型。
17.(x).pmc可以进一步经配置为基于一个或多个参数来确定是否优化检查方案，并且响应于肯定的确定来执行优化和使用。
18.(xi).一个或多个参数可以包括方案更新频率、方案性能历史、客户策略和情况分析。
19.(xii).检查方案进一步包括至少附加的第一分类器，并且pmc进一步经配置为执行获得、提取和重新训练以用于生成对应于至少附加的第一分类器的至少附加的第二分类器，并且用第二分类器和至少附加的第二分类器优化检查方案。
20.(xiii).存储单元可以存储由多个检验工具捕获的多个检验图像，并且第一分类器的重新训练根据基于多个性能参数选择的工作点，所述多个性能参数包括指示多个检验工具之间的变化的工具间差异参数。
21.(xiv).样本可以包括多个层，并且pmc经配置为对每个层执行检查方案的提取、重新训练和优化，并且pmc进一步经配置为基于来自多个层的训练数据来训练通用分类器，其中通用分类器可用于对一个或多个新的层执行分类。
22.根据当前公开的主题的其他方面，提供了一种可用于检查半导体样本的检查方案的自动优化的方法，所述方法包括：获得一个或多个检验图像，每个检验图像表示半导体样本的至少一部分，一个或多个检验图像指示使用包括在检查方案中的第一分类器从缺陷图中选择的相应缺陷候选；获得分别与一个或多个检验图像相关联并且提供相应缺陷候选的类型的信息的标签数据；提取表征一个或多个检验图像的检验特征；使用第一特征和标签数据重新训练第一分类器，从而产生第二分类器；以及通过用第二分类器替换第一分类器
来优化检查方案；其中经优化的检查方案可用于检查后续的半导体样本。
23.所公开的主题的这方面可以包括以技术上可能的任何期望组合或排列的加以必要修改的上文关于所述系统列出的特征(i)至(xiv)中的一个或多个。
24.根据当前公开的主题的其他方面，提供了一种包括指令的非暂时性计算机可读介质，所述指令在由计算机执行时使计算机执行可用于检查半导体样本的检查方案的自动优化的方法，所述方法包括：获得一个或多个检验图像，每个检验图像表示半导体样本的至少一部分，一个或多个检验图像指示使用包括在检查方案中的第一分类器从缺陷图选择的相应缺陷候选；获得分别与一个或多个检验图像相关联并且提供相应缺陷候选的类型的信息的标签数据；提取表征一个或多个检验图像的检验特征；使用第一特征和标签数据重新训练第一分类器，从而产生第二分类器；以及通过用第二分类器替换第一分类器来优化检查方案；其中经优化的检查方案可用于检查后续的半导体样本。
25.所公开的主题的这方面可以包括以技术上可能的任何期望组合或排列的加以必要修改的上文关于所述系统列出的特征(i)至(xiv)中的一个或多个。
附图说明
26.为了理解本公开内容并且了解本公开内容如何在实践中执行，现将参考附图仅通过非限制性示例的方式来描述实施例，在附图中：
27.图1示出了根据当前公开的主题的某些实施例的用于检查半导体样本的检查系统和用于自动优化可由检查系统使用的检查方案的系统的功能框图。
28.图2示出了根据当前公开的主题的某些实施例的可用于检查半导体样本的检查方案的自动优化的一般化流程图；
29.图3示出了根据当前公开的主题的某些实施例的训练无监督模型、监督模型、和分类器的一般化流程图。
30.图4示出了根据当前公开的主题的某些实施例的重新训练分类器的示意图。
31.图5a和图5b示出了根据当前公开的主题的某些实施例的关于检验工具和审查工具的方案优化器实现方式的两个示意图。
32.图6a示出了根据当前公开的主题的某些实施例的示出工具间差异的示意图。
33.图6b示出了根据当前公开的主题的某些实施例的基于多个参数的工作点选择的图示。
34.图7a示出了根据当前公开的主题的某些实施例的针对给定层的gpc与特定于层的分类器之间的性能比较的图。
35.图7b示出了根据当前公开的主题的某些实施例的关于特定于层的分类器的gpc的成本和性能的图。
具体实施方式
36.在以下详细描述中，阐述众多具体细节来提供对本公开内容的透彻理解。然而，本领域的技术人员将理解，当前公开的主题可以在没有这些具体细节的情况下实践。在其他实例中，未详细描述熟知的方法、程序、部件和电路，以便不混淆当前公开的主题。
37.除非另作具体声明，如从以下讨论显而易见的，应理解，在整个本说明书的讨论
中，采用诸如“检查”、“获得”、“提取”、“重新训练”、“优化”、“确定”、“生成”、“训练”、“捕获”、“审查”、“执行”、“存储”、“选择”等等术语是指将数据操纵和/或变换为其他数据的计算机的(多个)动作和/或(多个)处理，所述数据表示为物理的，诸如电子、数量和/或表示物理物体的所述数据。术语“计算机”应当被广泛地解释为涵盖任何种类的具有数据处理能力的基于硬件的电子装置，作为非限制性示例，所述电子装置包括在本技术中公开的检查系统、方案优化系统及其相应部分。
38.本文使用的术语“非暂时性存储器”和“非暂时性存储介质”应当被广泛地解释为涵盖适用于当前公开的主题的任何易失性或非易失性计算机存储器。
39.本说明书中使用的术语“样本”应当被广泛地解释为涵盖用于制造半导体集成电路、磁头、平板显示器、和其他半导体制造的制品的任何种类的物理物体或基板，包括晶片、掩模、掩模版和其他结构、其组合和/或部分。样本在本文中也称为半导体样本，并且可以通过执行对应制造工艺的制造设备来产生。
40.本说明书中使用的术语“检查”应被广泛地解释为涵盖与样本中的缺陷的检测和/或分类相关的任何种类的操作，以及在样本制造期间的计量相关的操作。通过在制造要检查的样本期间或之后使用非破坏性检查工具来提供检查。作为非限制性示例，检查过程可以包括使用相同或不同的检验工具来进行运行时扫描(以单次或多次扫描)、取样、审查、测量、分类和/或关于样本或其部分提供的其他操作。同样，检查可以在制造待检查的样本之前提供，并且可以包括例如生成(多个)检查方案和/或其他设置操作。应当注意到，除非另外具体声明，否则本说明书中使用的术语“检查”或其衍生词不限于关于检验区域的分辨率或大小。作为非限制性示例，各种非破坏性检查工具包括扫描电子显微镜(sem)、原子力显微镜(afm)、光学检验工具等。
41.本说明书中使用的术语“缺陷”应当被广泛地解释为涵盖在样本上或样本内形成的任何种类的异常或不期望的特征。
42.本说明书中使用的术语“设计数据”应当被广泛地解释为涵盖指示样本的分层物理设计(布局)的任何数据。设计数据可以由相应设计者提供和/或可以从物理设计(例如，通过复杂模拟、简单几何和布尔运算等)导出。设计数据可以以不同格式提供，作为非限制性示例，如gdsii格式、oasis格式等。设计数据可以以向量格式、灰度强度图像格式或其他格式呈现。
43.应理解，除非另外具体声明，否则在独立实施例的上下文中描述的当前公开的主题的某些特征也可以在单个实施例中组合提供。相反，在单个实施例的上下文中描述的当前公开的主题的各种特征也可以单独地或以任何合适的子组合来提供。在以下详细描述中，阐述众多具体细节以便提供对方法和设备的透彻理解。
44.考虑到这一点，将注意转向图1，图1示出了根据当前公开的主题的某些实施例的用于检查半导体样本的检查系统和用于自动优化可由检查系统使用的检查方案的系统的功能框图。
45.图1中示出的检查系统100可以用于检查(例如，晶片和/或其部分的)半导体样本作为样本制造(fab)过程的部分。系统100可以使用检查方案来检查半导体样本。本文使用的术语“检查方案”应当被广泛地解释为涵盖可以用于检查样本的任何种类的方案，包括可用于检验、检测、分类以及计量相关的操作等的(多个)方案。检查系统100可以包括一个或
多个检查工具，所述检查工具经配置成捕获图像和/或审查所捕获的(多个)图像和/或实现或提供与所捕获的(多个)图像有关的测量。
46.本文使用的术语“(多个)检查工具”应当被广泛地解释为涵盖可以在检查相关的过程中使用的任何工具，作为非限制性示例，所述检查相关的过程包括成像、扫描(以单次或多次扫描)、取样、审查、测量、分类和/或关于样本或其部分提供的其他过程。检查工具可以包括(多个)检验工具和/或(多个)审查工具。检验工具经配置为扫描样本(例如，整个晶片、整个管芯或其部分)以捕获检验图像(通常，以相对高速度和/或低分辨率)来用于检测潜在缺陷。审查工具经配置为捕获由(多个)检验工具检测到的缺陷中的至少一些缺陷的审查图像，以用于确认潜在缺陷是否确实为缺陷。这种审查工具通常经配置为一次一个地检验管芯的片段(通常，以相对低速度和/或高分辨率)。检验工具和审查工具可以是位于相同或不同位置的不同工具或在两种不同模式下操作的单个工具。在一些情况下，至少一个检查工具可以具有计量能力。
47.根据某些实施例，检查系统100可以包括如图1所示的一个或多个检验工具110和一个或多个审查工具114。检验工具110经配置为使用检查方案111来检测样本上的缺陷。作为示例，检查方案111可以是包括缺陷检测和分类功能(在图1中示出为检测模块112和分类器模块113)的检验方案。检查方案以及包括在其中的功能模块可以实现为在非暂时性计算机可读存储器上体现的计算机可读指令，所述非暂时性计算机可读存储器包括在检验工具110中的处理器或处理单元(在图1中未分别示出)中。处理器可以经配置为根据计算机可读指令执行功能模块以执行缺陷检测。
48.具体地，检验工具110可以根据缺陷检测模块112来扫描样本以捕获检验图像并且检测潜在缺陷。检测模块的输出是指示半导体样本上的缺陷候选分布的缺陷图。分类器113经配置为从缺陷图中选择缺陷候选的列表作为具有更高的概率是感兴趣的缺陷(doi)的候选。下文参考图2描述缺陷检测模块和分类器模块的细节。
49.本文使用的术语“感兴趣的缺陷(doi)”指使用者所感兴趣的待检测的任何真实缺陷。例如，如与也是真实缺陷但不影响产量并由此应当忽略的噪扰类型的缺陷相比，可导致产量损失的任何“致命”缺陷可以被指示为doi。
50.本文使用的术语“噪扰”应当被广泛地解释为包括任何不希望的或不感兴趣的缺陷，以及在检验期间由不同变化(例如，过程变化、颜色变化、机械和电气变化等)导致的随机噪声。噪扰有时也称为错误警报。
51.由分类器选择的缺陷候选的列表可以被提供给审查工具113。审查工具113经配置为捕获列表中的各个缺陷候选的位置处的审查图像，并且审查审查图像以确定缺陷候选是否确实是doi。审查工具的输出可以包括分别与缺陷候选的列表相关联的标签数据，所述标签数据提供缺陷候选类型的信息。
52.在不以任何方式限制本公开内容的范围的情况下，还应当注意到，(多个)检验工具110和/或(多个)审查工具114可以被实现为各种类型的检查机器，诸如光学成像机器、电子束机器等等。在一些情况下，相同的检查工具可以提供低分辨率图像数据和高分辨率图像数据。
53.根据某些实施例，检验图像和/或审查图像可以从包括以下各项的群组中选择：在制造过程期间捕获的样本的多个图像，以及通过各种预处理阶段获得的捕获图像的衍生
物。作为示例，检验图像可以是由光学检验工具或sem捕获的晶片或光掩模的部分的图像。作为另一示例，审查图像可以是下列各项中的一项或多项：大致以将由adc分类的缺陷为中心的sem图像；较大区域的sem图像，在所述较大区域中缺陷将由adr定位；对应于相同掩模位置的不同检查形态的配准图像；分割图像；高度图图像等。应当注意，在一些情况下，检验图像和/或审查图像可以包括图像数据(例如，所捕获的图像、所处理的图像等)和相关联的数字数据(例如，元数据、手工制造的(hand-crafted)属性等)。还应当注意，图像数据可以包括关于感兴趣的层和/或样本的一个或多个层的数据。
54.根据当前公开的主题的某些实施例，检查系统100可以包括能够使用从检查工具获得的检查数据来自动优化检查方案的基于计算机的系统101。因此，系统101在本文中也称为方案优化系统或方案优化器。如图1所示，系统101可以操作地连接到一个或多个检验工具111和一个或多个审查工具114。
55.系统101包括处理器和存储器电路系统(pmc)102(也称为处理单元)，处理器和存储器电路系统(pmc)102操作地连接到基于硬件的i/o接口126。如参考图2进一步详述，pmc 102经配置为提供操作系统101所必需的处理，并且包括处理器(未单独示出)和存储器(未单独示出)。pmc 102的处理器可以经配置为根据计算机可读指令执行若干功能模块，所述计算机可读指令在pmc中包括的非暂时性计算机可读存储器上实现。这种功能模块在后文被称为包括在pmc中。
56.根据某些实施例，pmc 102中所包括的功能模块可以包括特征提取器104、训练引擎106、分类器113、和方案更新模块108。pmc 102可以经配置为例如经由i/o接口126从检验工具110接收一个或多个检验图像，每个检验图像表示半导体样本的至少一部分。一个或多个检验图像指示使用包括在检查方案111中的分类器113(也称为第一分类器)从缺陷图中选择的相应缺陷候选。pmc 102可以经配置为例如从审查工具114接收分别与一个或多个检验图像相关联并且提供相应缺陷候选的类型的信息的标签数据。
57.特征提取器104可以经配置为提取表征一个或多个检验图像的检验特征。在一些情况下，如下文将参考图2详述的，可以将特征提取器实现为无监督学习模型，而在一些其他情况下，可以将特征提取器实现为监督学习模型。训练引擎106可以经配置为使用第一特征和标签数据重新训练第一分类器113，从而产生第二分类器。方案更新模块108可以经配置为通过用第二分类器替换第一分类器来优化检查方案。并且检验工具110可以使用优化的检查方案来检查后续的半导体样本。
58.应当注意，如在整个说明书、附图和权利要求书中使用的术语“第一”并不意味着第一实例/实体等。而是所述术语用于与“第二”实例/实体等相区分。作为示例，第二分类器是基于第一分类器重新训练和更新的分类器，因此不同于第一分类器。在本公开内容的某些实施例中，术语“分类器”和“更新的分类器”被等效地用作术语“第一分类器”和“第二分类器”。作为另一示例，第二特征是指与第一特征不同的特征。
59.将参考图2进一步详述系统100、系统101、pmc 102及其中的功能模块的操作。
60.根据某些实施例，系统101可以包括存储单元122。存储单元122可以经配置为存储操作系统101所必需的任何数据(例如，关于系统101的输入和输出的数据)，以及由系统101生成的中间处理结果。作为示例，存储单元122可以经配置为存储由检查工具产生的图像和/或其衍生物，以及与其相关联的标签数据。在一些实施例中，存储单元122可以经配置为
存储用于训练分类器和/或其他机器学习模型的训练数据。由此，所存储的数据可以从存储单元122检取并且被提供给pmc 102用于进一步处理。
61.在一些实施例中，系统101可以可选地包括基于计算机的图形用户界面(gui)124，图形用户界面124经配置为实现关于系统101的用户指定的输入和/或呈现处理输出。例如，可以为用户提供样本的视觉表示(例如，通过形成gui 124的部分的显示器)，所述视觉表示包括样本的图像数据。可选地，可以通过gui为用户提供定义某些操作参数的选项。用户也可以在gui上查看某些操作结果，诸如例如，缺陷图、标签数据、分类器输出，例如，缺陷候选列表等。系统101进一步经配置为经由i/o接口126向检验工具发送更新的分类器。在一些情况下，系统101可以进一步经配置为将结果中的一些发送到存储单元122、和/或外部系统(例如，fab的产量管理系统(yms))。
62.根据某些实施例，本文提及的机器学习模型(诸如特征提取器、分类器等)可以被实现为各种类型的机器学习模型，诸如例如，统计模型、神经网络、决策树、支持向量机、以及遗传模型、或其整体/组合等。由学习模型使用的学习算法可以是下列各项中的任何一项：监督学习、无监督学习、或半监督学习等。作为示例，特征提取器可以实现为无监督模型或监督模型。当前公开的主题不限于由学习模型使用的特定类型或学习算法。
63.在一些实施例中，学习模型中的一个或多个可以实现为深度神经网络(dnn)，所述深度神经网络(dnn)包括根据相应dnn架构组织的层。作为非限制性示例，dnn的层可以根据卷积神经网络(cnn)架构、循环神经网络架构、递归神经网络架构、生成对抗网络(gan)架构等等来组织。可选地，层的至少部分可以在多个dnn子网络中组织。dnn的每个层可以包括多个基本计算元件(ce)，在本领域中通常称为维度、神经元、或节点。
64.通常，给定层的ce可以与前一层和/或后一层的ce连接。前一层的ce与后一层的ce之间的每个连接与加权值相关联。给定ce可以经由相应连接从前一层的ce接收输入，每个给定连接与加权值相关联，所述加权值可以应用于给定连接的输入。加权值可以确定连接的相对强度并且因此确定相应输入对给定ce的输出的相对影响。给定ce可以经配置为计算激活值(例如，输入的加权和)并且通过将激活函数应用于所计算的激活来进一步导出输出。例如，激活函数可以是恒等函数、确定性函数(例如，线性、s形、阈值等等)、随机函数、或其他合适的函数。来自给定ce的输出可以经由相应连接被发送到后一层的ce。同样地，如上所述，ce的输出处的每个连接可以与加权值相关联，所述加权值可以在作为后一层的ce的输入被接收之前应用于ce的输出。进一步对于加权值，可以存在与连接和ce相关联的阈值(包括限制函数)。
65.dnn的加权值和/或阈值可以在训练之前被初始选择，并且可以在训练期间被进一步迭代地调整或修改，以在训练的dnn中实现最优的加权值和/或阈值集合。在每次迭代之后，可以确定在dnn产生的实际输出与和相应的训练数据集相关联的目标输出之间的差值。所述差值可以被称为误差值。当指示误差值的成本函数小于预定值时，或者当实现迭代之间性能的有限改变时，可以确定训练完成。可选地，可以在训练整个dnn之前单独训练dnn子网(如果有的话)的至少部分。
66.每个机器学习模型具有作为训练阶段的部分而计算的参数集(诸如例如，如上所述的dnn的加权值和/或阈值)。用于调整深度神经网络的权重/阈值的dnn输入数据的集合在下文中被称为训练集或训练数据集或训练数据。如先前提及，如下文将参考图3详述的，
学习模型的训练可以在训练阶段期间由训练模块106执行。
67.应当注意，上文示出的dnn架构仅出于示例性目的并且仅是实现机器学习模型的一种可能方式，并且当前公开的主题的教示不限于如上文描述的特定模型和架构。
68.根据某些实施例，除了分类器113之外，检验工具110可以包括一个或多个附加的后处理模块，诸如附加的分类器、过滤器等，并且方案优化系统101可以用于以类似的方式优化这些模块。在一些情况下，检查系统100可以包括用于分别更新检查方案中包括的一个或多个后处理模块的一个或多个系统101。在一些实施例中，系统101可以用于优化可用于审查工具114的方案。
69.本领域的技术人员将容易理解，当前公开的主题的教示不限于图1所示的系统；等效和/或修改的功能可以以另一方式合并或分开，并且可以以软件与固件和/或硬件的任何适当组合来实现。
70.应当注意，图1所示的系统可以在分布式计算环境中实现，其中先前提及的图1所示的功能模块可以分布在若干本地和/或远程装置上，并且可以通过通信网络链接。还应当注意，在另一实施例中，存储单元122和/或gui 124中的至少一些可以在系统101外部并且经由i/o接口126与系统101数据通信地操作。系统101可以实现为与检查工具结合使用的(多个)独立式计算机。替代地，在一些情况下，系统101的相应功能可以至少部分地与一个或多个检查工具集成，由此在检查相关的过程中促进并增强检查工具的功能。
71.目前用于检查半导体样本的检查方案具有高复杂度，并且目前的方案评估和调节过程通常是基于fab数据和/或用户反馈手动完成的，并且因此相当耗时且低效。作为示例，检查方案的评估通常需要等待，直到从审查工具接收到标签数据，这在时间和资源方面是昂贵的。此外，通常在给定晶片上在给定时间进行方案设置。在大多数情况下，在设置期间使用的给定晶片不能表示在生产期间将遇到的所有doi类型和噪声状况，因此导致运行时检查结果由于晶片/过程变化而不是最优的。
72.最近已经使用机器学习技术来辅助检查过程，然而将机器学习技术应用于晶片检验通常需要足够量的训练数据，并且在各种检查工具之间(例如，在检验工具与审查工具之间)的当前数据共享规划在技术上是麻烦的，并且在一些情况下在训练阶段期间导致数据不可访问和不足。
73.当前公开的主题的某些实施例通过与在线检验和检测流程并行地使用重新训练过程来实现自动且高效的方案优化。如下文将参考图2进一步解释的，重新训练过程基于从运行时检验图像提取的特征以及与其对应的标签数据。方法是基于机器学习的，具有最少的用户校准和交互。
74.仅出于说明的目的，关于晶片提供本公开内容的某些实施例。同样，实施例可以以类似方式应用于其他类型的样本。
75.参见图2，示出了根据当前公开的主题的某些实施例的可用于检查半导体样本的检查方案的自动优化的一般化流程图。
76.可以(例如，由系统101中的pmc 102)获得一个或多个检验图像(202)。检验图像可以经由i/o接口126从检验工具110接收、或者从存储单元122检取。每个检验图像表示半导体样本的至少一部分。一个或多个检验图像指示使用包括在检查方案中的第一分类器从缺陷图中选择的相应缺陷候选。
77.如上文提及，检验图像由检验工具捕获。根据某些实施例，检验工具可以经配置为捕获样本(例如，晶片或管芯或其部分)的检验图像。检验图像可以获自(多个)不同的检查形态，并且本公开内容不限于用于生成图像的检验和计量技术。样本的捕获图像可以使用检查方案(其功能可以集成在检验工具的处理单元内)中所包括的缺陷检测模块(诸如图1所示的检测模块112)来处理，以便生成指示样本上的缺陷候选分布的缺陷图(即，具有高概率是感兴趣的缺陷(doi)的样本上的可疑位置)。
78.不同的检验和检测方法可以在缺陷检测模块中应用来处理检验图像并生成缺陷图，诸如管芯对管芯(d2d)、管芯对历史(d2h)、管芯对数据库(d2db)等，并且本公开内容不限于其中使用的具体检测技术。仅出于说明目的，现在描述基于检验图像的缺陷检测和缺陷图生成的几个非限制性示例。
79.在一些实施例中，对于每个检验图像，一个或多个参考图像可以用于缺陷检测。参考图像可以以各种方式获得，并且本文使用的参考图像的数量和获得这些图像的方式不应被解释为以任何方式限制本公开内容。在一些情况下，一个或多个参考图像可以从相同样本的一个或多个管芯(例如，检验管芯的相邻管芯)捕获。在一些其他情况下，一个或多个参考图像可以包括从另一样本(例如，与本样本不同但共用相同设计数据的第二样本)的一个或多个管芯捕获的一个或多个图像。作为示例，在管芯对历史(d2h)检验方法中，检验图像可以在当前时间(例如，t＝t')从当前样本捕获，并且一个或多个参考图像可以包括在基线时间(例如，先前时间t＝0)从第二样本上的一个或多个管芯捕获的一个或多个先前图像。在一些进一步实施例中，一个或多个参考图像可以包括表示一个或多个管芯的给定管芯的至少一个模拟图像。作为示例，模拟图像可以基于管芯的设计数据(例如，cad数据)来生成。
80.在一些实施例中，至少一个差值图像可以基于在检验图像的像素值与从一个或多个参考图像导出的像素值之间的差值来生成。可选地，至少一个等级图像也可以基于至少一个差值图像来生成。在一些情况下，等级图像可以由像素和预定义的差值归一化因子构成，所述像素具有基于差值图像中的对应像素值计算的值。预定义的差值归一化因子可以基于像素值的正常总体的行为来确定，并且可以用于对差值图像的像素值进行归一化。作为示例，像素等级可以计算为差值图像的对应像素值与预定义的差值归一化因子之间的比率。缺陷图可以通过使用检测阈值基于至少一个差值图像或至少一个等级图像确定疑似缺陷的位置来生成。
81.在一些实施例中，所生成的缺陷图可以提供缺陷候选集合的信息，每个缺陷候选与一个或多个缺陷特性相关联，所述缺陷特性包括诸如例如，相应缺陷候选的位置、强度和大小等。
82.使用包括在检查方案中的分类器模块(诸如图1所示的分类器模块113)，可以从缺陷图中选择缺陷候选列表作为具有更高概率是感兴趣的缺陷(doi)的候选。
83.本文提到的术语“分类器”、“分类器模块”或“分类模块”应当被广义地解释为涵盖能够基于训练数据集识别新实例属于类别/类的集合中的哪一个的任何学习模型。作为示例，分类器可以将缺陷候选分类为两种类型：doi或噪扰。在这种情况下，分类器是二元分类器，并且也可以被称为经配置为从缺陷图中过滤出噪扰类型的缺陷候选的过滤器或噪扰过滤器。作为另一示例，分类器可以识别缺陷候选的具体缺陷类别，诸如例如，桥，粒子等。作为进一步的示例，分类器可以将缺陷候选分类为doi和噪扰，并且对于分类为doi的候选，分
类器还可以识别其具体缺陷类别(doi的子类)。分类器可以被实现为各种类型的机器学习模型，诸如例如，线性分类器、支持向量机(svm)、神经网络、决策树等，并且本公开内容不限于用其实现的具体模型。
84.根据某些实施例，分类器基于表征检验图像的输入特征/属性来对缺陷图中的缺陷候选集合执行选择/分类。具体地，对于每个缺陷候选，可以从样本的检验图像中分别提取周围图像面片(即，在每个给定缺陷候选的位置周围的图像面片)，从而产生与缺陷候选集合相对应的检验图像面片集合。作为示例，可以根据预定义的形状和大小来提取图像面片。如下文参考步骤206所描述，可以提取表征检验图像面片的某些特征并将其用作分类器的输入。分类器可以基于从对应的检验图像面片中提取的特征对每个缺陷候选执行分类。分类器的输出可以是由分类器选择为具有较高概率是doi的缺陷候选的列表(也称为选择的列表或选择的缺陷候选)。如下文参考步骤208和图3进一步详述，为了使分类器能够基于提取的特征选择/分类缺陷候选，需要在投入生产之前适当地训练分类器。
85.可以将由分类器选择的缺陷候选列表提供给审查工具(诸如例如，如图1所示的审查工具113)。审查工具可以在所选择的缺陷候选的位置处捕获审查图像，并且审查所述审查图像以确定缺陷候选是doi还是噪扰。审查工具的输出可以包括分别与缺陷候选列表相关联的标签数据。如下文参考步骤208和图3进一步详细描述的，标签数据提供缺陷候选的类型的信息并且可以用于分类器和/或其他机器学习模型的训练。
86.继续图2的描述，为了及时和有效地优化检查方案，例如，以便更新分类器，使得其能够以更高的准确度和捕获率执行doi的分类，当前公开的主题提出并行地应用离线优化过程与由检查工具执行的检查过程(例如，如图1所示，由系统101执行的方案优化过程与由检验工具110使用检查方案111执行的缺陷检测过程和由审查工具114执行的缺陷审查过程并行/分离)。根据某些实施例，方案优化系统收集来自工具的最新生产数据和反馈信息，并使用收集的数据重新训练分类器，并且重新训练的分类器可以代替检查方案中的先前分类器，从而产生用于检查后续样本的优化/更新的方案。以这样的方式，分类器基于最新的生产数据被频繁地和自动地更新，因此对于晶片/工艺变化等更加稳健。
87.具体地，如上所述，在步骤202中，由方案优化系统101从检验工具110接收的一个或多个检验图像实际上是与由分类器选择的缺陷候选列表相对应的一个或多个检验图像面片。从样本的检验图像中(例如，在每个给定缺陷候选的位置周围)提取每个检验图像面片，并且因此表示样本的至少一部分。一个或多个检验图像面片指示所选择的缺陷候选。
88.方案优化系统101还(例如，由系统101中的pmc 102)获得(204)分别与一个或多个检验图像(即，检验图像面片)相关联的标签数据。标签数据用作检验图像的反馈信息和基本真值(ground truth)数据。如上所述，标签数据可以从审查工具114或存储单元122接收，并且提供相应缺陷候选的类型的信息。
89.可以(例如，由pmc 102中的特征提取器104)提取(206)表征一个或多个检验图像的检验特征。根据某些实施例，检验特征可以包括由无监督模型提取的第一特征。在一些情况下，作为第一特征的补充或替代，检验特征可以包括由监督模型提取的第二特征。作为示例，第二特征可以包括下列各项中的至少一项：i)表征一个或多个检验图像的特征向量，以及ii)指示检验图像上的每个缺陷候选属于特定类型/类别的概率(例如，每个缺陷候选是doi的概率)的标签预测特征。
90.在一些另外的情况下，作为包括第一特征和/或第二特征的检验特征的补充或替代，可以使用附加的第三特征(诸如，例如表征捕获一个或多个检验图像的检验工具的物理属性的工具特征)来重新训练分类器。工具特征可以直接从检验工具中导出。如将在下文进一步详细描述的，第三特征也可以包括缺陷特征和/或样本特征。
91.以如上所述的各种方式提取的表征一个或多个检验图像的检验特征连同基本真值数据(即，与检验图像相关联的标签数据)一起被提供作为训练数据用于(例如，由如图1所示的训练模块106)重新训练(206)分类器。注意到，如系统101中示出的分类器113应该被认为是包括在由检验工具110使用的检查方案111中用于检验样本和检测缺陷候选的分类器113的离线版本。如下文参考图3进一步详细地描述的，分类器在训练阶段期间使用一个或多个训练检验图像和与其相关联的标签数据被预先训练。
92.现参见图4，示出了根据当前公开的主题的某些实施例的重新训练分类器的示意图。
93.检验工具捕获样本(例如，晶片或管芯)的检验图像402。在使用检查方案执行缺陷检测和分类之后，由分类器从缺陷图中选择缺陷候选的列表，并且从与所选择的缺陷候选相对应的检验图像402中提取一个或多个检验图像面片404。例如，将图像面片404提取为围绕每个给定缺陷候选的位置的窗口。如上所述，将所选择的缺陷候选提供给审查工具114，并且可以由审查工具114生成提供相应缺陷候选的类型的信息的标签数据403。将标签数据分别与一个或多个检验图像面片的所选择的缺陷候选相关联。
94.在一些实施例中，将一个或多个图像面片404馈入无监督模型406以提取其代表性特征。作为示例，无监督模型406可以实现为自动编码器或其变体。自动编码器是一种神经网络，通常用于通过学习高效的数据编码并重构其输入(例如，最小化输入与输出之间的差异)来进行数据再现。自动编码器具有输入层、输出层以及连接它们的一个或多个隐藏层。通常，自动编码器可以被认为包括编码器和解码器这两个部分。自动编码器学习将来自输入层的数据压缩成短代码(即，编码器部分)，并且随后将此代码解压缩成与原始数据紧密匹配的输出(即，解码器部分)。编码器的输出被称为代码、潜在变量、或表示输入图像的潜在表示408。代码可以通过解码器中的隐藏层，并且可以在输出层中重建成与输入图像相对应的输出图像。
95.一旦基于一组训练检验图像训练了自动编码器(如下文参考图3详细描述的)，经训练的自动编码器能够为每个输入图像生成基于其潜在表示紧密匹配输入的重构的输出图像。因此，在当前情况下，对于馈送到自动编码器中的每个检验图像面片，由自动编码器生成的代码或潜在表示408可以用作表示检验图像面片的所提取的特征。由无监督模型提取的特征在本文中也称为第一特征，并且可以作为输入的部分提供给分类器113用于重新训练目的。此外，在一些实施例中，在一些情况下，还可以将重构的输出图像连同输入图像一起作为输入的一部分提供给分类器113用于重新训练目的。
96.应当注意，自动编码器的以上示例仅出于示例性和说明性目的而描述，并且不应视为以任何方式限制本公开内容。除上述之外或代替上述，可以使用其他类型的无监督模型。作为示例，可以使用任何密度估计方法，诸如例如，统计图形模型(例如，归一化流模型、自回归模型、贝叶斯(baysian)网络、马尔科夫(markov)网络等)或者非图形模型(例如，变分推理模型、高斯混合模型等)。
97.在一些实施例中，附加地或替代地，可以将一个或多个图像面片404馈入监督模型410。监督模型410可以在具有监督学习模式的各种机器学习模型中实现，所述机器学习模型诸如例如cnn，svm等。在一些实施例中，监督模型可以实现为被训练以学习特征和分类数据的分类模块。在监督模型410的训练阶段期间，将由审查工具114生成的标签数据403作为基本真值提供给监督模型。如下文参考图3所详细描述的，可以使用一组训练检验图像中的一个或多个训练检验图像以及相应相关联的标签数据来训练监督模型410。一旦被训练，训练的监督模型410就能够提取特征并且使用特征来确定/分类缺陷候选的类型。
98.在一个示例中，监督模型可以实现为卷积神经网络(cnn)。cnn通常具有包括输入和输出层以及多个隐藏层的结构。cnn的隐藏层通常包括一系列卷积层，所述卷积层与乘法或其他点积进行卷积，随后是附加层，诸如池化层、完全连接层、和归一化层等。在一些情况下，cnn可以被视为由两个主要功能组成：特征提取和分类。作为示例，特征提取部分可以包括若干卷积层，随后是最大池化和激活函数。分类部分通常包括完全连接层。
99.作为示例，在一些情况下，监督模型的特征提取部分中的某些中间层(例如，卷积层中的一个或多个)可以以特征图(也称为特征向量)的形式提供层输出，并且这样的输出特征图中的一个或多个可以用作要提供给分类器的提取特征。
100.例如，可以例如通过跨输入特征图的宽度和高度卷积特定层的每个过滤器、计算过滤器的条目与输入之间的点积、以及产生给出此过滤器在每个空间位置处的响应的二维激活图来生成输出特征图。沿深度维度堆叠所有过滤器的激活图形成卷积层的全部输出特征图。结果，cnn学习到当在输入中的某个空间位置检测到某个特定类型的特征时激活的滤波器。因此，输出特征图可以被视为包括从输入提取并且表示输入的特征。如图4所例示的，这样的特征图中的一个或多个可以从监督模型410的某些中间层412中提取，并且可以作为输入提供给训练模块106以用于重新训练分类器113。
101.作为另一示例，监督模型的分类部分中的某些中间层(例如，在最后一层之前的完全连接层中的一个或多个)可以提供包括指示标签预测概率(即，输入被指派有特定标签的概率)的特征的层输出。这种特征在本文中也称为标签预测特征。在当前情况下，这些特征可指示检验图像上的每个给定缺陷候选属于特定类型的概率。在一些情况下，这样的层是输出层之前的最后层，并且基于由这些层输出的标签预测特征来确定标签。根据某些实施例，这样的标签预测特征可以用作要被提供给分类器的提取特征，作为如上所述的特征图的补充或替代。如图4所例示的，标签预测特征可以从监督模型410的分类部分中的特定层414(在输出层之前)提取，并且作为输入提供给训练模块106以重新训练分类器113。为了将由监督模型提取的特征图和/或标记预测特征与其他提取的特征(诸如，第一特征或第三特征)区分开，由监督模型提取的特征图和/或标记预测特征在本文中也称为第二特征。
102.根据某些实施例，除了第一特征和/或第二特征之外，还可以提取一个或多个第三特征416并且将其提供给训练模块106以用于重新训练分类器113。作为示例，第三特征可以包括表征检验工具的物理属性的工具特征，所述检验工具捕获一个或多个检验图像。这样的工具特征可以包括下列各项中的一项或多项：检测器、显微镜、光散射等的一个或多个物理属性。
103.在一些实施例中，附加地或替代地，第三特征可以包括缺陷特征，诸如例如，与缺陷候选的大小、形状和位置等有关的一个或多个属性等。例如，缺陷特征之一可以是指示缺
陷候选的位置是更靠近晶片的中心还是更靠近晶片的边缘的位置属性。这样的缺陷特征可以向分类器提供附加的缺陷信息。在另一示例中，一个缺陷特征可以是指示缺陷候选大小的大小属性。对于具有小于预定大小的大小的缺陷候选，缺陷候选可以与点扩散函数关联，点扩散函数经配置为将晶片中的点转移到其对应的图像表示(即，将如何在检验图像中出现)。这是因为在一些情况下，由于工具分辨率的限制，光学检验工具不能将所有晶片数据转移到检验图像中。由此，通过与点扩散函数关联，可以获得附加的晶片信息并将其提供给分类器。在一些进一步实施例中，附加地或替代地，第三特征可以包括样本特征(例如，晶片特征)，诸如例如，晶片图案、晶片电气功能等。
104.根据某些实施例，如图1所示的特征提取器104可以实现为无监督模型(例如，图4中的无监督模型406)，并且用于重新训练分类器的检验特征可以包括由无监督模型提取的第一特征。在一些实施例中，特征提取器104可以实现为监督模型(例如，图4中的监督模型410)，并且用于重新训练分类器的检验特征可以包括由监督模型提取的第二特征(例如，特征图和/或标签预测特征)。在一些进一步的实施例中，特征提取器104可以实现为包括无监督模型和无监督模型两者(例如，图4中的无监督模型406和监督模型410两者)，并且用于重新训练分类器的检验特征可以包括第一特征和第二特征两者。在又进一步的实施例中，附加地并且可选地，特征提取器可以包括工具特征提取器(图4中未示出)，所述工具特征提取器经配置为从检验工具中提取第三特征416。
105.应当注意，尽管如图4所示的结构包括无监督模型406和监督模型410以及第三特征416，它们都操作地连接到分类器113以用于重新训练，但是这仅用于示例性目的，而不应被认为以任何方式限制本公开内容。可以实现如上所述的替代系统结构和实现方式(例如，仅包括监督模型或仅包括无监督模型，具有或不具有第三特征)来代替上述。还应当注意，诸如无监督模型406和监督模型410之类的某些功能模块的示意性展示仅出于非限制性示例性目的而示出，而并非旨在指示这样的模块的特定结构。由此，在不脱离本公开内容的范围的情况下，可以对这样的模块进行各种结构和/或功能改变/调整。
106.在收集包括表征一个或多个检验图像(即，检验图像面片)的检验特征的运行时数据和分别与检验图像相关联的标签数据403之后，训练模块106可以使用所收集的运行时数据作为训练数据来重新训练分类器113。重新训练的分类器能够确定检验图像上的缺陷候选属于特定类型(例如，doi)的概率。如上所述，分类器113可以被认为是在用于检查当前样本并且生成所选择的缺陷候选的检查方案中使用的分类器的离线版本。
107.如下文参考图3所描述的，在一些实施例中，训练模块106可以进一步经配置为在重新训练分类器113之前，使用运行时数据(例如，一个或多个检验图像以及可能还有与其相关联的标签数据)在运行时重新训练无监督模型和/或监督模型。作为示例，可以确定在收集新的运行时数据之后，训练模块可以经配置为使用运行时数据重新训练监督模型，并且一旦监督模型被训练，就使用由监督模型和无监督模型提取的特征和/或第三特征重新训练分类器。作为另一示例，可以确定响应于新运行时数据的收集重新训练监督模型和无监督模型两者。作为进一步的示例，还可以确定每当有新的运行时数据时重新训练监督模型，并且仅每隔预定的时间间隔(例如，每n个晶片)重新训练无监督模型。应当注意，如下文参考图3所描述的，在一些情况下，第三特征可以用于训练无监督模型和/或监督模型和/或分类器。
108.现参见图3，示出了根据当前公开的主题的某些实施例的训练无监督模型、监督模型和分类器的一般化流程图。
109.根据某些实施例，在监督模型和/或无监督模型被用作用于提取和提供用于重新训练分类器的特征的特征提取器之前，可以用相应的训练数据预先训练监督模型和/或无监督模型。在310中，示出了无监督模型的训练阶段。可以获得(312)各自代表样本的至少一部分的一组训练检验图像作为第一训练集，并且可以使用第一训练集来训练(314)无监督模型以提取其代表性特征。作为示例，如上文参考图4所描述的，第一训练集中的训练检验图像可以包括与如在一个或多个样本的缺陷图中指示的缺陷候选相对应的提取的检验图像面片。第一训练集是没有标记数据的图像数据集。无监督模型可以通过处理每个图像来训练以生成输出重建图像，并且基于相对于输入图像的输出来优化参数。在一些实施例中，还可以获得如上所述的第三特征并且将其与一组训练检验图像一起使用以训练无监督模型。在这种情况下，第一训练集包括一组训练检验图像和第三特征。
110.如上所述，作为示例，可以将无监督模型实现为自动编码器或其任何合适的变型/衍生物。无监督模型也可以实现为基于密度估计方法的任何模型，诸如任何图形或非图形模型。对于训练数据集中的每个输入图像，自动编码器可以提取代表输入图像的特征，并且使用代表性特征来重构可以通过与输入图像进行比较来评估的对应输出图像。自动编码器被训练和优化，以便学习训练图像中的代表性特征(例如，在训练图像中可以表示例如结构元素、图案、像素分布等的特征)。结构元素指的是图像数据上具有几何形状或具有轮廓的几何结构的任何原始对象。在一些情况下，结构元素可以指形成图案的多个组合物体。例如，结构元素可以以多边形的形式呈现。
111.应当注意，根据当前公开的主题的某些实施例，本文使用的第一训练集可以包括整个fab检验数据，诸如例如，在制造过程期间捕获的低分辨率检验图像、或者通过可能与元数据和/或通用属性相关联的各种预处理阶段获得的捕获图像的衍生物等。在一些情况下，第一训练集可以包括与来自所有制造阶段的所有类型的层/产品有关的检验数据。替代地，在一些其他情况下，第一训练集可以包括根据某些标准(例如，(多个)特定层/(多个)特定产品等)选择的某些可用检验数据。
112.在320中，示出了监督模型的训练阶段。可以获得(322)来自与标签数据相关联的一组训练检验图像的一个或多个训练检验图像。一个或多个训练检验图像和相关联的标签数据形成第二训练集，并且可以使用第二训练集来训练(324)监督模型以确定缺陷候选的类型。根据某些实施例，一个或多个训练检验图像是从整组训练检验图像(即，第一训练集)中选择的，所述整组训练检验图像用于以与上文参考图4描述的类似方式训练无监督模型。作为示例，可以从缺陷图中选择具有较高概率是doi的缺陷候选列表。将所选择的缺陷候选提供给审查工具，并且提供所选择的缺陷候选的类型的信息的标签数据可以由审查工具生成。从第一训练集中选择第二训练集中的一个或多个训练检验图像作为与标签数据相关联的所选择的缺陷候选相对应的图像。可以通过对第二集合中的每个训练图像进行处理以生成预测标签并且基于与给定图像相对应的标签数据对参数进行优化来训练监督模型。在一些实施例中，还可以获得如上所述的第三特征，并且将其与关联于标签数据的一个或多个训练检验图像一起使用，以训练监督模型。在这种情况下，第二训练集包括一个或多个训练检验图像、标签数据、以及第三特征。
113.根据某些实施例，可以分别训练和优化监督模型和无监督模型。例如，它们可以并行训练、或者相继训练。
114.如上文参考图4所描述的，一旦无监督模型和监督模型被训练，这样的模型就可以进入推断阶段，以便处理运行时检验图像并且提供所提取的特征以重新训练分类器。在330中，示出了分类器的示例性训练阶段。训练模块可以获得(332)由无监督模型从一个或多个检验图像中提取的第一特征，和/或获得(334)由监督模型从一个或多个检验图像中提取的第二特征，和/或获得(335)第三特征。训练模块还从审查工具获得(336)与一个或多个检验图像(例如，一个或多个检验图像面片404)相关联的标签数据。训练模块使用所收集的运行时数据(即，所提取的特征和标签数据)作为训练数据来重新训练(338)分类器。分类器可以被不断地重新训练(例如，响应于从检查工具获得的新的检验数据和标签数据)，以便保持其与不断变化的fab数据的相关性。
115.应当注意，如上文参考图4所描述的，在一些情况下，在重新训练分类器之前，还可以基于运行时数据在运行时期间重新训练无监督模型和/或监督模型。在这种情况下，训练模块106可以进一步经配置为以与上文参考框310和框320所描述的方式类似的方式使用运行时数据重新训练无监督模型和/或监督模型。
116.返回参见图2，一旦使用检验特征和标签数据重新训练(208)分类器，重新训练的分类器也称为更新的分类器、或第二分类器(相对于重新训练之前的分类器，所述分类器也称为第一分类器)。第二分类器可以用于替换包括在由检验工具使用的检查方案中的第一分类器，由此(例如，由方案更新模块108)优化(210)检查方案。
117.在一些实施例中，方案更新模块108可以经配置为基于一个或多个参数来确定是否优化检查方案，并且仅响应于肯定的确定来执行优化。一个或多个参数可以包括方案更新频率、方案性能历史、客户策略和情况分析等。作为示例，这些参数之一可以是预定的方案更新频率。例如，针对每个晶片(即，每次在对晶片进行检验和审查之后)更新方案，并且检验数据和审查数据用于重新训练分类器。在一些情况下，可以预定方案更新频率以针对每n(n》1)个晶片更新方案。作为另一示例，这些参数之一可以是客户策略，例如，在满足预定条件之后，客户可以确定更新方案。例如，客户可能希望稳定方案并且不更新方案，除非存在由审查工具报告的新类型的缺陷。如果从审查工具接收的标签数据指示存在新类型的缺陷，则分类器将被重新训练并且用于更新方案。
118.作为进一步的示例，参数之一可以是方案历史或方案性能历史。这样的参数可指示方案先前是否被更新，并且如果是，则指示更新的次数，以及相应的更新方案的对应性能。例如，如果方案最近未被更新并且上次更新的far没有满足客户要求(例如，不符合可接受的far的客户规格)，则可以决定当前方案应当被更新。作为又进一步示例，参数之一可以是基于当前fab情况的情况分析。例如，在一些情况下，fab将希望稳定方案，因此对于给定的持续时间不允许进一步的方案更新。在另一示例中，如果存在性能劣化，诸如例如，fab中的良率下降，则可以确定更新方案。
119.优化的检查方案可用于(212)(例如，由检验工具110)检查后续样本。在一些情况下，后续样本可以是紧接在当前样本之后的下一个样本，或者是相对于当前样本在n个样本的距离内的后续样本(n》1)。
120.现在转向图5a和图5b，示出了根据当前公开的主题的某些实施例的关于检验工具
和审查工具的方案优化器实现方式的两个示意图。
121.如上所述，方案优化器101可以实现为独立计算机以与检验工具110和审查工具112结合使用，或者替代地，方案优化器101的功能或其至少一部分可以与检验工具110或审查工具112集成。在图5a中，方案优化器101实现为与检验工具和审查工具操作地连接的独立单元。在检验工具110和审查工具112在运行时检查当前晶片n之后，方案优化器101从工具分别收集晶片n的检验数据和审查数据，并且使用所收集的数据重新训练包括在当前检验方案中且由检验工具110用于检查晶片n的分类器。重新训练的分类器可以由方案优化器101发送到检验工具110以替换方案中的当前分类器。
122.由于分类器的重新训练是离线执行的并且可能花费时间，因此当重新训练的分类器被发送以更新检验工具中的方案时，取决于重新训练分类器的时间相对于晶片检验和审查的时间，重新训练的分类器可以用于检查在生产线中的下一个晶片，所述晶片可能是晶片n+m。在这种场景中，对fab的检验输出是检验工具中的分类器的输出(此外，还可以将来自审查工具的审查输出提供给fab)。fab可以使用这样的输出用于过程控制的目的。作为示例，由第一分类器检查晶片1，并且第一分类器的输出将作为晶片1的检查结果提供给fab。一旦使用晶片1的数据离线重新训练了第一分类器，就使用重新训练的分类器来替换检验工具中的第一分类器。重新训练的分类器将检查在生产线中的下一个晶片，例如，晶片5，并且重新训练的分类器的输出将作为晶片5的检查结果提供给fab。
123.在一些情况下，可以在决定替换当前分类器之前评估重新训练的分类器。作为示例，重新训练的分类器可以用于基于晶片n的缺陷图生成所选择的缺陷候选的更新列表，并且可以将所选择的缺陷候选的更新列表与由当前分类器生成的所选择的缺陷候选的原始列表进行比较。可以基于比较结果做出是否通过替换分类器来更新方案的决定。
124.在图5b中，方案优化器101以与参考图5a描述的检验工具和审查工具类似的方式实现。然而，分类器模块的功能被从检验工具中取出，并且仅保持在方案优化器模块中。因此，对于当前晶片n，由检验工具的检测模块生成的缺陷图可以从检验工具110发送到方案优化器101，并且由包括在方案优化器101中的当前分类器处理以生成所选择的缺陷候选的列表。将列表作为晶片n的检验输出提供给fab。由方案优化器101基于晶片n的运行时数据重新训练分类器。重新训练的分类器不需要被发送到检验工具，而是被保持在方案优化器101中以用于检查下一个晶片n+1。可以将下一个晶片n+1的缺陷图从检验工具110发送到方案优化器101，并由方案优化器101中的重新训练的分类器进行处理以生成所选择的缺陷候选的列表。重新训练的分类器的输出将作为检验输出提供给fab。在一些情况下，来自审查工具的审查输出可以与检验输出一起被发送到fab。
125.将图5b与图5a的场景进行比较，应当注意，在图5b中实现的系统具有相对高的方案更新频率(例如，在检查每个晶片之后重新训练和更新分类器)，而同时在生成每个晶片的检查结果方面相对较慢(例如，仅可在使用晶片n的数据重新训练分类器之后检查晶片n+1)，而在图5a中实现的系统具有相对低的方案更新频率(例如，对于每m个晶片更新检验工具的方案中的分类器)，同时在生成每个晶片的检查结果方面相对较快(例如，可以使用当前分类器检查在晶片n与晶片n+m之间的每个晶片，直到分类器被重新训练并更新在方案中)。
126.应当注意，出于示例性的目的示出了图5a和图5b中所示的场景，并且不应当将其
视为以任何方式限制本公开内容。除上述之外或代替上述，本公开内容可以以上述的任一种方式实现，或以任何其他可能的实现方式实现。
127.根据某些实施例，方案优化器可从多个检验工具接收检验数据，并且考虑多个检验工具之间的工具间差异来优化分类器。如上所述，在运行时基于最新生产数据重新训练分类器可以将分类器增强为对晶片/工艺变化等更稳健。另外，当从不同工具接收检验数据时，由于工具间差异，优化分类器以改善一个工具的性能对于另一个工具的性能可能不是最佳的。因此，需要注意考虑工具间差异来选择最佳工作点，并且基于所选择的工作点来重新训练分类器。
128.现在转向图6a，示出了根据当前公开的主题的某些实施例示出工具间差异的示意图。
129.假设方案优化器从两个检验工具(例如，工具1和工具2)接收检验数据。基于这两个工具数据重新训练和优化分类器。图6a示出了坐标轴，其中x轴表示相应检验的晶片，并且y轴表示检验的晶片的对应错误警报率(far)。例示了在分类器的两个不同优化602和604之后两个工具的性能(根据far)。在602中，工具1与工具2的far之间的差异相对较小，而在604中，尽管工具2的far与602相比得以改善(即，减小)，但是工具1的far与602相比增加，因此导致工具1与工具2的far之间的更大差距并且影响工具1的性能，这是不为客户所期望的。应当注意，尽管在图中将相对于相应晶片的far图示出为直线，这仅是为了简化说明。本领域技术人员应理解，不同晶片的far值可能存在变化。
130.因此，提出在根据本公开内容的某些实施例优化分类器时选择最佳工作点以便考虑工具间差异。现在转向图6b，示出了根据当前公开的主题的某些实施例的基于多个参数的工作点的选择。
131.分类器性能可以用诸如far、doi捕获率(cr)、过滤率、准确度、纯度、拒绝率等某些性能度量来测量。性能度量可以是预定义的，并且可以确定类型/类别之间的阈值选择。所期望的分类性能和/或用于实现所选择的性能的类别的对应阈值的选择在本文中可以被称为分类器的工作点。
132.如图6b所示，图表的x轴表示捕获率(cr)，即在给定阈值处捕获的doi相对于整个已知doi总体的百分比。图表的y轴表示far，far被定义为对于给定阈值设置被分类为doi的缺陷内的噪扰或错误警报的百分比。图6b中的曲线图示了对应于不同系统性能的工作点集合。如图所示，在工作点wp2处，可以捕获更多的doi(即，doi捕获率相对较高)，然而，far也相对较高。在不同的工作点wp1处，far低于wp2，同时捕获率也降低。换句话说，在wp 1处，较少的噪扰缺陷被分类为doi，但这是以滤除一大部分doi为代价的。因此，在本示例中，每个工作点在捕获率与far这两个性能度量之间提供不同的折衷。应当注意，如图6b所示，除了far和cr之外或代替far和cr，可以使用不同的性能度量/参数来确定工作点。
133.根据本公开内容的某些实施例，为了考虑到工具间差异，提出在确定工作点时添加工具间差异作为附加参数(例如，将附加参数作为图6b的图表中除了far和cr之外的附加维度添加)。在一些情况下，可以根据预定条件选择工作点，以便试图使far和工具间差异最小化，同时使捕获率最大化。作为示例，工作点可以从由cr的下部范围和far的上部范围以及工具间差异限定的预定范围中选择。虽然图6b仅示出了两个示例性工作点，但是应当理解，工作点的预定范围可以表示为如图6b所示的分布在参数空间中的点云。
134.在训练期间，基于训练数据训练分类器，以便设置(多个)阈值，从而实现由工作点定义的期望性能。阈值可用于在被标识为属于给定类别的缺陷与被标识为不属于给定类别的缺陷之间进行区分。阈值因此也被称为边界或分隔线/平面，这取决于缺陷候选的属性超空间的维度。可以获得工作点与阈值的值之间的相关性。基于期望的工作点(性能量度的值)，可以确定类别的特定阈值(或阈值集合)。因此，经训练的分类器能够根据阈值确定作为多维属性空间(在本文中称为称为属性超空间)中的每个预定缺陷类别相关联的缺陷特征/属性的函数的给定缺陷候选的类别。具体地，分类器在运行时针对要分类的每个给定缺陷候选接收其特征的相应集合，并且应用(多个)阈值来相应地分类给定缺陷候选。根据所需的(多个)阈值，分类器在预定义的缺陷类别之间分割属性超空间，并且取决于每个缺陷候选在属性超空间中的位置，通过为每个缺陷候选指派缺陷类别之一来产生经分类的缺陷。
135.应当注意，尽管图6a和6b示出了两个检验工具之间的工具间差异的示例，但是这绝不应当被认为是限制本公开内容。可以以类似的方式将多个检验工具(例如，两个以上的检验工具)应用于当前公开的主题。作为示例，可以使用多个参数，每个参数指示一对工具之间的特定工具间差异。作为另一示例，当确定工作点时，可以使用指示多个工具间的组合/平均工具间差异的组合参数。作为进一步的示例，可以使用指示具有最差性能的工具与具有最佳性能的工具之间的变化的参数。
136.根据当前公开的主题的某些实施例，样本可以包括通过不同包括处理步骤制造的多个层。对于每个层，存在用于检验所述层的具体检查方案。具体方案可以包括基于层数据来训练的具体分类器。由此，对于包括层1至层n的产品，将存在对应于相应层而训练的n个分类器。可以使用上述优化过程重新训练并优化n个分类器中的每一个。这些分类器可以被称为层特定分类器。
137.在一些实施例中，通用分类器(gpc)可以使用从所有层收集的所有训练数据来生成和训练。gpc可使用所收集的训练数据训练一次，并且训练的gpc可以用于在运行时对所有层执行分类。由于gpc是基于关于不同层的相当大量的训练数据来训练的，所以可以假设训练的gpc已经看到各种类型的缺陷和噪扰，并且可以直接用于运行时分类而无需进一步重新训练。例如，当(当前产品或不同产品的)新的层到达时，gpc可以直接用于对新的层数据执行分类，而不必训练新的层特定分类器。
138.对于给定层，gpc作为更一般化的分类器，与针对给定层专门训练的层特定分类器相比可能具有较差的性能。图7a示出了根据当前公开的主题的某些实施例的针对给定层的gpc与层特定分类器之间的性能比较的图表。如图表中所示，x轴表示捕获率(cr)，并且y轴表示错误警报率(far)。对于新的层n+1，层特定分类器(表示为分类器n+1)具有比gpc更好的性能，例如，在给定的far下，分类器n+1的cr高于gpc中的cr，而在给定的cr下，分类器n+1的far低于gpc的far。
139.然而，与基于层训练数据训练并且将在运行时使用新的层数据不断地重新训练的层特定分类器相比，gpc具有不导致进一步训练成本的优点并且因此易于由客户使用。继续图7a中的示例，诸如分类器n+1之类的层特定分类器通常将具有与gpc相比更好的性能，而同时更昂贵，由于其需要来自fab的更多资源和用于重新训练的工具，如图7b所示。在一些情况下，有可能用gpc开始所述过程并且如果需要的话移至分类器n+1。例如，gpc可以用于
对新的层n+1执行分类，并且取决于性能，如果需要，可以确定训练层特定分类器以改善性能。
140.应当注意，所示出的示例在本文中仅出于说明的目的而描述，并且不应当被视为以任何方式限制本公开内容。除上述之外或代替上述，可以使用其他合适的示例。
141.如本文描述的方案优化过程的某些实施例的优点之一是在检查方案中包括的分类器可以基于最新的生产数据被频繁且自动地重新训练和更新，从而使得能够优化检查方案以对晶片/工艺变化等更加稳健。
142.如本文描述的方案优化过程的某些实施例的优点之一是使用各种类型的特征来重新训练分类器的能力，包括以各种方式(例如，通过监督和/或无监督的学习模型)提取的检验特征，可选地具有附加特征(诸如例如，工具特征和/或缺陷特征和/或晶片特征)，以便改进所训练的分类器的性能(例如，准确度)。
143.如本文描述的方案优化过程的某些实施例的优点之一是使用从检验图像中提取的检验特征而不是使用从审查图像中提取的特征，以便能够将大量的检验图像数据用于训练目的。例如，所有可用的检验图像(或其中至少一些)可以用作训练数据以用于训练无监督模型和/或监督模型，使得训练的模型能够出于重新训练目的向分类器提供运行时检验图像的可靠的代表性特征。
144.如本文描述的方案优化过程的某些实施例的优点之一是在训练分类器时考虑各种检验工具之间的工具间差异的能力，例如，通过基于多个性能参数选择工作点并且根据工作点执行重新训练，所述性能参数包括指示多个检验工具之间的变化的工具间差异参数。以这种方式重新训练的分类器对工具间变化更加稳健。
145.除了分类器模块之外或代替分类器模块，如本文当前公开的方案优化过程可以用于更新检查方案中的不同模块(例如，任何基于学习的模块)，这样的模块包括例如分割模块、降噪模块、像素参考模块、系统性能和协同校正模块等。
146.将理解，本公开内容不限于应用到在本文含有的描述中阐述或在附图中示出的细节。
147.也将理解，根据本公开内容的系统可以至少部分地在合适地编程的计算机上实现。同样，本公开内容构想到可由计算机读取的计算机程序以用于执行本公开内容的方法。本公开内容进一步构想到有形地体现指令程序的非暂时性计算机可读存储器，所述指令可由计算机执行以用于执行本公开内容的方法。
148.本公开内容能够具有其他实施例并且以各种方式实践和执行。因此，将理解，本文采用的措辞和术语是出于描述的目的并且不应当被认为是限制。因此，本领域的技术人员将了解，本公开内容所基于的概念可以容易用作设计其他结构、方法和系统的基础，以用于实现当前公开的主题的若干目的。
149.本领域的技术人员将容易理解，各种修改和改变可以在不脱离本公开内容的范围的情况下应用到如上文描述的本公开内容的实施例，本公开内容的范围在所附权利要求书中并由所附权利要求书限定。

技术特征：
1.一种可用于检查半导体样本的检查方案的自动优化的计算机化系统，所述系统包括：存储单元，经配置为存储：i)一个或多个检验图像，每个检验图像表示所述半导体样本的至少一部分，所述一个或多个检验图像指示使用包括在所述检查方案中的第一分类器从缺陷图中选择的相应缺陷候选；ii)标签数据，所述标签数据分别与所述一个或多个检验图像相关联并且提供所述相应缺陷候选的类型的信息；以及处理和存储器电路系统(pmc)，操作地连接到所述存储单元并且被配置为：提取表征所述一个或多个检验图像的检验特征；使用所述检验特征和所述标签数据重新训练所述第一分类器，从而产生第二分类器；以及通过用所述第二分类器替换所述第一分类器来优化所述检查方案；其中所述经优化的检查方案可用于检查后续的半导体样本。2.如权利要求1所述的计算机化系统，其中所述缺陷图由检验工具生成并且指示所述半导体样本上的缺陷候选分布。3.如权利要求1所述的计算机化系统，其中所述相应缺陷候选的所述类型中的每一者指示以下各项中的至少一项：感兴趣的缺陷(doi)、噪扰和相应缺陷候选的类别。4.如权利要求1所述的计算机化系统，其中所述检验特征包括由使用一组训练检验图像预先训练以提取所述一组训练检验图像的代表性特征的无监督模型提取的第一特征。5.如权利要求4所述的计算机化系统，其中所述第一分类器使用具有相应关联的标签数据的所述一组训练检验图像中的一个或多个训练检验图像来预先训练。6.如权利要求4所述的计算机化系统，其中所述检验特征进一步包括由监督模型提取的第二特征，所述监督模型使用具有相应关联的标签数据的所述一组训练检验图像中的一个或多个训练检验图像来预先训练以确定缺陷候选的类型。7.如权利要求6所述的计算机化系统，其中所述第二特征包括以下各项中的至少一项：i)表征所述一个或多个检验图像的特征向量，以及ii)指示检验图像上的每个给定缺陷候选属于特定类型的概率的标签预测特征。8.如权利要求1所述的计算机化系统，其中所述pmc经配置为除了所述检验特征和所述标签数据之外，还使用包括以下各项中的至少一项的第三特征来重新训练所述第一分类器：工具特征、缺陷特征和样本特征。9.如权利要求1所述的计算机化系统，其中所述pmc进一步经配置为在所述重新训练所述第一分类器之前使用所述一个或多个检验图像和所述标签数据来重新训练所述无监督模型和/或所述监督模型。10.如权利要求1所述的计算机化系统，其中所述pmc进一步经配置为基于一个或多个参数来确定是否优化所述检查方案，并且响应于肯定的确定来执行所述优化和使用。11.如权利要求10所述的计算机化系统，其中所述一个或多个参数包括方案更新频率、方案性能历史、客户策略和情况分析。12.如权利要求1所述的计算机化系统，其中所述检查方案进一步包括至少附加的第一分类器，并且所述pmc进一步经配置为执行所述获得、提取和重新训练以用于生成对应于所述至少附加的第一分类器的至少附加的第二分类器，并且用所述第二分类器和所述至少附
加的第二分类器来优化所述检查方案。13.如权利要求1所述的计算机化系统，其中所述存储单元存储由多个检验工具捕获的多个检验图像，并且其中所述第一分类器的所述重新训练根据基于多个性能参数选择的工作点，所述多个性能参数包括指示所述多个检验工具之间的变化的工具间差异参数。14.如权利要求1所述的计算机化方法，其中所述样本包括多个层，并且所述pmc经配置为对每个层执行所述检查方案的所述提取、重新训练和优化，并且所述pmc进一步经配置为基于来自所述多个层的训练数据来训练通用分类器，其中所述通用分类器可用于对一个或多个新的层执行分类。15.一种可用于检查半导体样本的检查方案的自动优化的计算机化方法，所述方法由处理和存储器电路系统(pmc)执行，所述方法包括：获得一个或多个检验图像，每个检验图像表示所述半导体样本的至少一部分，所述一个或多个检验图像指示使用包括在所述检查方案中的第一分类器从缺陷图中选择的相应缺陷候选；获得分别与所述一个或多个检验图像相关联并且提供所述相应缺陷候选的类型的信息的标签数据；提取表征所述一个或多个检验图像的检验特征；使用所述第一特征和所述标签数据重新训练所述第一分类器，从而产生第二分类器；以及通过用所述第二分类器替换所述第一分类器来优化所述检查方案；其中所述经优化的检查方案可用于检查后续的半导体样本。16.如权利要求15所述的计算机化方法，其中所述检验特征包括由使用一组训练检验图像预先训练以提取所述一组训练检验图像的代表性特征的无监督模型提取的第一特征。17.如权利要求16所述的计算机化方法，其中所述检验特征进一步包括由监督模型提取的第二特征，所述监督模型使用具有相应关联的标签数据的所述一组训练检验图像中的一个或多个训练检验图像来预先训练以确定缺陷候选的类型。18.如权利要求16所述的计算机化方法，其中所述第二特征包括以下各项中的至少一项：i)表征所述一个或多个检验图像的特征向量，以及ii)指示所述一个或多个检验图像上的缺陷存在的概率的标签预测特征。19.如权利要求16所述的计算机化方法，其中所述重新训练包括除了所述检验特征和所述标签数据之外，还使用包括以下各项中的至少一项的第三特征来重新训练所述第一分类器：工具特征、缺陷特征和样本特征。20.一种有形地体现指令程序的非暂时性计算机可读存储介质，所述指令在由计算机执行时使所述计算机执行可用于检查半导体样本的检查方案的自动优化的方法，所述方法包括：获得一个或多个检验图像，每个检验图像表示所述半导体样本的至少一部分，所述一个或多个检验图像指示使用包括在所述检查方案中的第一分类器从缺陷图选择的相应缺陷候选；获得分别与所述一个或多个检验图像相关联并且提供所述相应缺陷候选的类型的信息的标签数据；
提取表征所述一个或多个检验图像的检验特征；使用所述第一特征和所述标签数据重新训练所述第一分类器，从而产生第二分类器；以及通过用所述第二分类器替换所述第一分类器来优化所述检查方案；其中所述经优化的检查方案可用于检查后续的半导体样本。

技术总结
提供了检查方案的自动优化的系统和方法。所述方法包括：获得一个或多个检验图像，每个检验图像表示半导体样本的至少一部分，一个或多个检验图像指示使用包括在检查方案中的第一分类器从缺陷图选择的相应缺陷候选；获得分别与一个或多个检验图像相关联并且提供相应缺陷候选的类型的信息的标签数据；提取表征一个或多个检验图像的检验特征；使用第一特征和标签数据重新训练第一分类器，从而产生第二分类器；以及通过用第二分类器替换第一分类器来优化检查方案；其中经优化的检查方案可用于检查后续的半导体样本。查后续的半导体样本。查后续的半导体样本。

技术研发人员：A
受保护的技术使用者：应用材料以色列公司
技术研发日：2021.05.28
技术公布日：2022/3/8

专利

最新回复(0)