本發明所公開的技術涉及人工智能類型計算機和數字數據處理系統以及對應數據處理方法和用于仿真智能的產品(即,基于知識的系統、推斷系統和知識采集系統);并且包括用于不確定性推斷的系統(例如,模糊邏輯系統)、自適應系統、機器學習系統和人工神經網絡。具體地,所公開的技術涉及使用用于轉換人工神經網絡(ann)或可通過機器學習來訓練的另一類型的計算系統的上下文的技術。文獻并入以下文獻以引用方式并入,即如同在本文完整示出一樣,以用于所有目的:2021年10月6日提交的名稱為“protein?structure-based?protein?languagemodels”的美國臨時專利申請號63/253,122(代理人案卷號illm?1050-1/ip-2164-prv);2021年11月19日提交的名稱為“predicting?variant?pathogenicity?fromevolutionary?conservation?using?three-dimensional?(3d)?protein?structurevoxels”的美國臨時專利申請號63/281,579(代理人案卷號illm?1060-1/ip-2270-prv);2021年11月19日提交的名稱為“combined?and?transfer?learning?of?avariant?pathogenicity?predictor?using?gaped?and?non-gaped?protein?samples”的美國臨時專利申請號63/281,592(代理人案卷號illm?1061-1/ip-2271-prv);2017年10月16日提交的名稱為“training?a?deep?pathogenicity?classifierusing?large-scale?benign?training?data”的美國專利申請號62/573,144(代理人案卷號illm?1000-1/ip-1611-prv);2017年10月16日提交的名稱為“pathogenicity?classifier?based?on?deepconvolutional?neural?networks?(cnns)”的美國專利申請號62/573,149(代理人案卷號illm?1000-2/ip-1612-prv);2017年10月16日提交的名稱為“deep?semi-supervised?learning?thatgenerates?large-scale?pathogenic?training?data”的美國專利申請號62/573,153(代理人案卷號illm?1000-3/ip-1613-prv);2017年11月7日提交的名稱為“pathogenicity?classification?of?genomicdata?using?deep?convolutional?neural?networks?(cnns)”的美國專利申請號62/582,898(代理人案卷號illm?1000-4/ip-1618-prv);2018年10月15日提交的名稱為“deep?learning-based?techniques?fortraining?deep?convolutional?neural?networks”的美國專利申請號16/160,903(代理人案卷號illm?1000-5/ip-1611-us);2018年10月15日提交的名稱為“deep?convolutional?neural?networks?forvariant?classification”的美國專利申請號16/160,986(代理人案卷號illm?1000-6/ip-1612-us);2018年10月15日提交的名稱為“semi-supervised?learning?for?training?anensemble?of?deep?convolutional?neural?networks”的美國專利申請號16/160,968(代理人案卷號illm?1000-7/ip-1613-us);2019年5月8日提交的名稱為“deep?learning-based?techniques?for?pre-training?deep?convolutional?neural?networks”的美國專利申請號16/407,149(代理人案卷號illm?1010-1/ip-1734-us);2021年4月15日提交的名稱為“deep?convolutional?neural?networks?topredict?variant?pathogenicity?using?three-dimensional?(3d)?proteinstructures”的美國專利申請號17/232,056(代理人案卷號illm?1037-2/ip-2051-us);2021年4月15日提交的名稱為“multi-channel?protein?voxelization?topredict?variant?pathogenicity?using?deep?convolutional?neural?networks”的美國專利申請號63/175,495(代理人案卷號illm?1047-1/ip-2142-prv);sundaram,?l.等人,predicting?the?clinical?impact?of?human?mutationwith?deep?neural?networks.nat.?genet.50,?1161–1170?(2018)(下文稱為“primateai”);jaganathan,?k.等人,predicting?splicing?from?primary?sequence?withdeep?learning.cell?176,?535-548?(2019);2021年4月16日提交的名稱為“efficient?voxelization?for?deep?learning”的美國專利申請號63/175,767(代理人案卷號illm?1048-1/ip-2143-prv);以及2021年9月7日提交的名稱為“artificial?intelligence-based?analysis?ofprotein?three-dimensional?(3d)?structures”的美國專利申請號17/468,411(代理人案卷號illm?1037-3/ip-2051a-us)的優先權。
背景技術:
1、本部分中討論的主題不應僅因為在本部分中有提及就被認為是現有技術。類似地,在本部分中提及的或與作為背景技術提供的主題相關聯的問題不應被認為先前在現有技術中已被認識到。本部分中的主題僅表示不同的方法,這些方法本身也可對應于受權利要求書保護的技術的具體實施。
2、神經網絡
3、圖1示出具有多個層的人工神經網絡(ann)的一個具體實施。ann(或同樣在本文中所述,神經網絡)是在彼此之間交換消息的互連人工神經元(例如,a1、a2、a3)的系統。所示出神經網絡具有三個輸入、隱藏層中的兩個神經元和輸出層中的兩個神經元。隱藏層具有激活函數并且輸出層具有激活函數。連接具有在訓練過程期間被調諧的數字權重(例如,w11、w21、w12、w31、w22、w32、v11、v22),使得在饋送圖像以識別時,經正確訓練的網絡正確地響應。輸入層處理原始輸入,隱藏層基于輸入層與隱藏層之間的連接的權重來處理來自該輸入層的輸出。輸出層獲得來自隱藏層的輸出,并且基于隱藏層與輸出層之間的連接的權重對該輸出進行處理。該網絡包括多層的特征檢測神經元。每層具有許多神經元,該神經元對來自先前層的輸入的不同組合做出響應。這些層被構造成使得第一層檢測輸入圖像數據中的一組基元模式,第二層檢測模式的模式,并且第三層檢測那些模式的模式。
技術實現思路
1、本文描述了用于轉換ann的上下文或可通過機器學習訓練的另一類型的計算系統的上下文的技術。在一些具體實施中,該技術將計算系統(諸如ann)的第一上下文轉換為計算系統的第二上下文,該第一上下文用于提供群體的基因組的變異(例如,錯義變異)的致病性,該第二上下文用于提供群體的基因組的indel的致病性。
2、在提供此類技術時,本文所述的系統和方法克服了從其中計算系統的上下文被改變的計算系統獲得得分時的一些技術問題。此外,本文所公開的技術提供了特定的技術方案以至少克服本文所提及的技術問題以及本文未描述但本領域技術人員認識到的其他技術問題。
3、關于一些具體實施,本文公開了用于轉換ann的上下文或另一類型的計算系統的上下文的計算機化方法,以及用于執行計算機化方法的技術操作的非暫態計算機可讀存儲介質。非暫態計算機可讀存儲介質具有有形地存儲在其上或有形地編碼在其上的計算機可讀指令,該計算機可讀指令在由一個或多個設備(例如,一個或多個個人計算機或服務器)執行時使得至少一個處理器執行用于轉換ann的上下文或另一類型的計算系統的上下文的方法。