全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210348203.4 (22)申请日 2022.04.01 (71)申请人 梁晶 地址 210000 江苏省南京市浦口区公园北 路775号 (72)发明人 梁晶  (51)Int.Cl. G06F 21/60(2013.01) G06F 21/62(2013.01) (54)发明名称 一种基于数据云采集的验证系统 (57)摘要 本发明公开了一种基于数据云采集的验证 系统, 包括隐私协议数据模块、 隐私行为提取记 录模块和统计验证模块, 所述隐私协议数据模块 用于对程序应用的APK文件包含的数据进行获取 调用, 所述隐私行为提取记录模块用于对APP页 面嵌入的隐私协议进行树状图层次遍历的自动 提取和记录, 所述统计验证模块用于通过构建 API与关键词的映射将隐私行为与隐私协议进行 匹配分析, 所述隐私协议数据模块与隐私行为提 取记录模块电连接, 所述隐私行为提取记录模块 与统计验证模块电连接, 通过输入待检测的APK 样本生成组件树状图, 提取隐私协议文本组成映 射列表, 利用关键词与隐私协议进行匹配分析, 本发明, 具有自动化比对和提高研究效率的特 点。 权利要求书3页 说明书7页 附图1页 CN 114817950 A 2022.07.29 CN 114817950 A 1.一种基于数据云采集的验证系统, 包括隐私协议数据模块、 隐私行为提取记录模块 和统计验证模块, 其特征在于: 所述隐私协 议数据模块用于对程序应用的APK文件包含的数 据进行获取调用, 所述隐私行为提取记录模块用于对APP页面嵌入的隐私协议进行树状图 层次遍历的自动提取和记录, 所述统计验证模块用于通过构建API与关键词的映射将隐私 行为与隐私协议进行匹配分析, 所述隐私协议数据模块与隐私行为提取记录模块电连接, 所述隐私行为 提取记录模块与统计验证模块电连接 。 2.根据权利要求1所述的一种基于数据云采集的验证系统, 其特征在于: 所述隐私协议 数据模块包括APK文件结构模块、 隐私协 议模块和API调用行为模块, 所述APK文件 结构模块 用于获取应用程序的数据资源和安装文件, 所述隐私协议模块用于获取APP开发者在上架 APP时在应用市场展示的声明权限和隐私协议链接, 所述API调用行为模块用于获取APP隐 私协议中调用其他应用程序的敏感调用接口或函数, 所述APK文件结构模块与隐私协议模 块电连接, 所述隐私协议模块与API调用行为模块电连接; 所述隐私协议模块包括 隐私权限子模块、 隐私权政策链接子模块, 所述 隐私权限子模 块用于获取APP开 发者在上架APP时在应用市场展示的声明权限, 所述隐私 权政策链接子模 块用于获取APP开发者在上架APP时是否在应用市场展示隐私协 议的跳转链接, 所述隐私 权 限子模块与隐私权政策链接 子模块电连接 。 3.根据权利要求2所述的一种基于数据云采集的验证系统, 其特征在于: 所述隐私行为 提取记录模块包括APK样 本预处理模块、 静态分析模块、 隐私协 议文本提取模块和调用行为 记录模块, 所述APK样本预处理模块用于对获取的数据资源和代码文件样本进行预处理操 作, 所述静态分析模块用于采集XML文件中的声明信息和生 成组件树状图, 所述隐私协 议文 本提取模块用于利用层次遍历树状图进行隐私协 议页面的寻找和提取, 所述调用行为记录 模块用于触发记录应用程序的敏感API调用行为, 所述APK样 本预处理模块与静态分析模块 电连接, 所述隐私协议文本提取模块与调用行为记录模块电连接 。 4.根据权利要求3所述的一种基于数据云采集的验证系统, 其特征在于: 所述统计验证 模块包括关键词映射模块、 隐私行为转换模块、 匹配 分析模块和判定输出模块, 所述关键词 映射模块用于将敏感API与经人工校验后的隐私协议文本中的关键词建立映射列表, 所述 隐私行为转换模块用于根据映射列 表将隐私行为记录结果转换为对应关键词, 所述匹配分 析模块用于将隐私行为对应的关键词 与隐私协 议进行匹配分析, 所述判定输出模块用于根 据分析判断输出风险等级结果, 所述关键词映射模块与隐私行为转换模块电连接, 所述匹 配分析模块与判定 输出模块电连接 。 5.基于权利要求1 ‑4中任一项所述的一种基于数据云采集的验证系统的数据云采集验 证方法, 所述方法包括以下步骤: 步骤S1: 输入待检测的APK样本, 进行样本数据的反编译以及XML文件信息提取的预处 理操作, 生成组件树状图; 步骤S2: 利用层次遍历策略生成组件树状图队列, 使用控制命令打开队首组件页面, 通 过该页面的控件树判断该页面是否含有隐私协议链接, 寻找隐私协议所在页面, 提取隐私 协议文本; 步骤S3: 通过词向量模型提取隐私协议中描述隐私信息的关键词, 并与选取的敏感API 组成映射列表;权 利 要 求 书 1/3 页 2 CN 114817950 A 2步骤S4: 通过API关键词映射列表, 将提取到的隐私行为转换为关键词, 将隐私行为对 应的关键词与隐私协议进行匹配分析, 输出判定结果。 6.根据权利要求5所述的一种基于数据云采集的验证系统, 其特征在于: 所述步骤S1 中, 所述的APK文件是指使用开 发语言开 发后, 将源代码和应用程序中使用的资源文件和数 据资源, 通过相关工具签名打包成A ndroid程序安装文件进 行安装, 然后形成的各种可使用 的APP应用; 所述XML文件是记录了应用程序的各种配置信 息的文件, 主要包括应用程序的包名, 所 需的最低安卓API级别, 各个组件的声明信息等, 只有正确 配置XML文件才能在将源代码和 资源文件打包成APK安装文件; 所述API是指一个程序和其他软件的沟通通道, 即两个程序或软件间预先定义的调用 函数或接口; 所述组件树状图又称Activity树状图, 是安卓应用程序中四大组件之一, 主要负责管 理程序中的用户界面, 通常一个应用程序会包含若干个组件, 每一个组件负责一个用户界 面的展现。 7.根据权利要求6所述的一种基于数据云采集的验证系统, 其特征在于: 所述步骤S2进 一步包括以下步骤: 步骤S21: 使用反编译软件对APK样本进行反编译, 获得文件目录下应用程序可以调试 的代码文件和包 含各种应用信息的XML文件, 提取需要 使用的各种AP P信息数据; 步骤S22: 创建目标组件类的实例, 遍历所有S mali文件生成的类名集合, 从集合中取出 APP启动类, 设置生成一个根节点 为APP启动类的树状图; 步骤S23: 将APP启动 类加入队列, 取出队列头部节点并将其子节点全部加入队列, 判断 该节点是否为组件入口类, 并设置父子关系去除树状图中的非组件入口类节点, 生成组件 树状图; 步骤S24: 采用层次遍历策略根据组件树状图生成对应的组件队列, 进行APP隐私协议 页面所属组件定位, 通过队首组件页面中的用户界面控件, 判断该页面是否含有隐私协议 链接, 并进行隐私协议内容 提取。 8.根据权利要求7所述的一种基于数据云采集的验证系统, 其特征在于: 所述步骤S3进 一步包括以下步骤: 步骤S31: 选取 敏感调用接口或函数, 建立关键词列表, 形成接口函数与关键词的映射; 步骤S32: 通过隐私政策报告提取出与隐私信 息相关的第 一批备选关键词, 同步使用经 过隐私协议文本训练的词向量模型, 计算与第一批关键词语义相 近的单词, 经过检校后加 入到备选关键词中; 步骤S33: 将备选关键词分为精确匹配词和模糊匹配词, 建立得到列表形式的两大类关 键词; 步骤S34: 将选取的敏感调用接口和函数依次与相关的备选关键词建立映射关系。 9.根据权利要求8所述的一种基于数据云采集的验证系统, 其特征在于: 所述步骤S34 中, 安卓系统中APP在 进行安装时存在一些敏感的调用函数或接口, 作用是调用其他应用程 序中的某一类使用权限。 10.根据权利要求9所述的一种基于数据云采集的验证系统, 其特征在于: 所述步骤S4权 利 要 求 书 2/3 页 3 CN 114817950 A 3

PDF文档 专利 一种基于数据云采集的验证系统

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于数据云采集的验证系统 第 1 页 专利 一种基于数据云采集的验证系统 第 2 页 专利 一种基于数据云采集的验证系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-07 12:39:46上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。