Cyberbullying is a major problem in society, and the damage it causes is becoming increasingly significant. Previous studies on cyberbullying focused on detecting and classifying malicious comments. However, our study focuses on a substantive alternative to block malicious comments via identifying key offenders through the application of methods of text mining and social network analysis (SNA). Thus, we propose a practical method of identifying social network users who make high rates of insulting comments and analyzing their resultant influence on the community. We select the Korean online community of Daum Agora to validate our proposed method. We collect over 650,000 posts and comments via web crawling. By applying a text mining method, we calculate the Losada ratio, a ratio of positive-to-negative comments. We then propose a cyberbullying index and calculate it based on text mining. By applying the SNA method, we analyze relationships among users so as to ascertain the influence that the core users have on the community. We validate the proposed method of identifying key cyberbullies through a real-world application and evaluations. The proposed method has implications for managing online communities and reducing cyberbullying.  相似文献   

The utilization of traditional social survey data to address today’s bullying problems presents some limitations. In response, a new method to investigate and subsequently intervene is warranted. Therefore, this study analyzed big data generated by social media to identify Future Signals of bullying. This approach may contribute to effectively clarifying the problem and suggesting targeted interventions to address the bullying phenomenon in South Korea. For social big data analysis, 350,314 web documents were collected per hour each day from January 1, 2013 to June 30, 2017, from 279 subject channels based on an ontology of bullying-related topics. Term frequency, document frequency, degree of visibility, and degree of diffusion were computed to identify Future Signals. A substantial overlap of findings between studies based on social big data and traditional survey results was observed for family (e.g., parental divorce, domestic violence, child abuse), peer (e.g., transfer, friend violence), economic (e.g., economic problem), and school/academic (e.g., academic record, school control, academic stress) strain domains, whereas strains concerning the media (e. g., movie, celebrity) and cultural (e.g., materialism, hell Korea) domains seemed to be more salient in social big data. Weak Signal topics in social big data representing media and cultural strain domains (e.g., Youtube, class society, bullying culture) related to the bullying phenomenon appear to be emerging in significance. These topics and their respective strain domains represent potentially important new areas that warrant further investigation by practitioners and policymakers. These findings may allow the early detection of crucial information by providing data to support better informed insight and intervention related to the complex problem of bullying in South Korea.  相似文献   

近几年IT应用技术飞速发展,企业私有云和容器技术使系统应用越来越动态,与此同时,移动互联网对于最终用户的体验和安全保障也越来越高,但传统的系统运维与监控无法适用这些变化。本文提出了一种通过网络流量分组解析与大数据挖掘来提升IT系统运管能力的解决方案。  相似文献   

本文简要介绍了垃圾短信对社会带来的负面影响,分析了目前垃圾短信治理体系存在的不足,提出了基于大数据挖掘分析的垃圾短信治理方案:首先构建垃圾短信用户识别指标体系,通过引入随机森林模型,对垃圾短信用户进行识别和有效治理,最后运用平台对垃圾短信用户进行精细化管理。  相似文献   

为了开发一个中国邮政储蓄银行某分行的信贷风险管理系统,采用了数据挖掘技术。首先对数据挖掘和数据仓库技术的相关概念进行了介绍,对现有的信贷管理情况进行了分析,结合我国银行业的实际特点,得到了一个基于数据挖掘的信贷风险管理模型的设计和实现方法。在此基础上,通过在分类以前进行属性选择,不仅改善了分类器的总体性能,也降低了数据采集成本,可以提高银行信贷工作的效率。  相似文献   

王铮  任华  方燕萍 《电信科学》2016,32(12):7-12
电信运营商有大量数据,但是鉴于多种原因,数据的质量不够理想,出现大量数据不完整甚至缺失。对于已有数据的挖掘,必须在数据满足质量要求且达到足够采样比例的前提下开展。依托现有的全国日志留存系统,设计完整数据的模板样库,鉴别不能满足质量要求的数据,使用随机森林算法,找到最符合的相同或相关数据,补全数据并提升数据质量;用回溯反馈的方法优化并扩充模板样库。在全国日志留存系统中构建数据补全子系统,实现端到端的数据质量保障和提升,补全并改善历史数据甚至实时数据的质量,最终满足数据处理和挖掘的要求,提升运营商数据质量和价值。  相似文献   

在大数据时代,依靠以机器学习为代表的人工智能技术从海量、复杂多样的电磁大数据中快速挖掘出有效的信息是当前的研究热点。面向电磁数据的机器学习算法具有多样性、多变性的特点,要求相关人员具有专业能力与编程知识。为解决电磁大数据挖掘实现过程中的复杂编程问题,提出面向电磁大数据的图形化编程平台,将机器学习的各类算法组件化,用户无需编写代码即可建立机器学习模型和工作流分析数据,并以可视化的方式分析电磁数据,帮助用户进一步理解数据,具有快速开发与易上手的优点。  相似文献   

随着人工智能和机器学习等几项重要技术的发展,使得大数据渗透各个领域并伴随着各种网络化的应用.文中主要研究异构大数据环境下的深度关联挖掘方法,构造了一个层次混合网络模型来描述不同实体之间的多类型关系,并设计了一个基于深度强化学习框架的智能路由器,让其结合模型,最终实现了一种智能推荐机制,用于支持学术大数据环境下用户的协同...  相似文献   

丁建球 《电子测试》2020,(12):105-106
新时期,社会经济高速发展,各种先进的科学技术层出不穷,例如大数据技术,凭借其容量大、多样性以及速度快等特点在各个领域中都得到良好的应用,给人们的生活与工作带去了极大的便利,同时也带来了一些新的风险因素。公共服务领域运用大数据可以显著提高服务效率与质量,并且可以实现服务现代化建设,是未来公共服务改革与创新的主要发展趋势。为此,我们有必要在运用大数据的过程中对其可能造成的风险进行分析,提前做出有效的应对。  相似文献   

姜帅 《电子测试》2014,(22):158-159
本文在研究中,通过对篮球技术动作数据采集和预处理的分析应用,又研究了基于Apriori算法的关联规则挖掘,进而对篮球技术动作之间的关联性进行研究。  相似文献   

随着时代的发展,信息技术在各个领域均得到广泛运用,计算机软件技术也越发凸显出其重要性。大数据时代为人们的生活带来了便利,使日常工作变得更加高效。文章从大数据时代下计算机软件技术的内涵着手,提出了计算机软件处理数据的技术手段及应用方向,对计算机软件的相关应用展开论述。  相似文献   

芦海燕 《电子测试》2014,(Z1):73-75
随着电子商务的蓬勃发展,电子商务信息、数据日益增加,商家想要对这些商务信息进行有效的组织和处理,得出其内在联系并提取有用信息。根据这一实际需求出发,该课题对数据挖掘的概念、意义、方法、工作过程进行了详细论述,并设计了一种基于Web的数据挖掘推荐系统。  相似文献   

大数据技术的发展促进了各个领域的发展变革,也促进了现代化生活水平的提高,给当前的移动通信带来了机遇与挑战。5G通信网络具有传输快、延迟低等特点,是移动通信当前的发展趋势。文章对大数据技术在5G通信技术中的应用进行探究,分析其应用的可行性,提出具有可行性的建议,以便于更好地促进移动通信的发展。  相似文献   

目前,移动终端已成为运营商维系用户、拓展市场的战略重心,提升移动终端销量、扩大终端规模是各运营商的工作重点。基于数据挖掘技术,从用户属性、终端使用信息、终端搜索访问信息等维度出发,挖掘海量用户行为数据价值,建立终端换机模型,具体包括基于决策树算法的用户换机倾向识别模型和基于聚类算法的终端推荐模型,助力移动终端精准营销。  相似文献   

在大学教育体系中,数学学科是一门逻辑严谨的学科。基础薄弱的学生,在学习数学时,往往比较吃力,甚至有畏惧心理。文章通过前期对于学生数学学习数据的分析和研究得知,目前大部分的数学教学效果情况并不乐观,教学内容以及手段相对单一。因此,为了可以进一步提升数学课堂教学的效果,让学生数学学习成绩有所提高,教师在数学教学过程中,可以融入大数据技术。  相似文献   

面向网络大数据的安全分析技术应用   总被引:1,自引:1,他引:0  
大数据分析技术的蓬勃发展,给安全行业带来了许多新的思路和发展机遇.从电信运营商视角,深入解析了面向Netflow、DPI、DNS等网络大数据资源的大数据安全分析平台的架构、技术实现机制等,并介绍了大数据安全分析产品的相关功能和应用场景.  相似文献   

The configuration of urban projects using Information and Communication Technologies is an essential aspect in the education of future architects. Students must know the technologies that will facilitate their academic and professional development, as well as anticipating the needs of the citizens and the requirements of their designs. In this paper, a data mining approach was used to outline the strategic requirements for an urban design project in an architecture course using a Project-Based Learning strategy. Informal data related to an award-winning public space (Gillett Square in London, UK) was retrieved from two social networks (Flickr and Twitter), and from its official website. The analysis focused on semantic, temporal and spatial patterns, aspects generally overlooked in traditional approaches. Text-mining techniques were used to relate semantic and temporal data, focusing on seasonal and weekly (work-leisure) cycles, and the geographic patterns were extracted both from geotagged pictures and by geocoding user locations. The results showed that it is possible to obtain and extract valuable data and information in order to determine the different uses and architectural requirements of an urban space, but such data and information can be challenging to retrieve, structure, analyze and visualize. The main goal of the paper is to outline a strategy and present a visualization of the results, in a way designed to be attractive and informative for both students and professionals – even without a technical background – so the conducted analysis may be reproducible in other urban data contexts.  相似文献   

郑磊  韩鹏军 《信息技术》2021,(1):163-168
针对误用检测方法和异常检测方法缺少对网络风险因素分析,导致网络漏洞检出率较低的问题,提出了基于大数据H adoop技术检测网络安全漏洞研究.构建标准化直接关系矩阵、生成总关系矩阵确定网络风险元素属性,由此分析网络风险.构建Hadoop框架,采集入侵行为漏洞信息,搭建核心装置,处理网络漏洞.避免外力干扰情况下,评估网络漏...  相似文献   

杨文君  宋妍 《信息技术》2007,31(7):119-121
应用模糊数据挖掘方法,给出了模糊数据挖掘中基于聚类分析的算法以及详细的模糊聚类分析步骤,对复杂的客户需求进行合理聚类,充分体现客户需求的个性化与产品模块的完备性。模糊数据挖掘能够对将来的趋势和行为进行预测,从而很好地支持人们的决策。  相似文献   

随着现代电子商务的不断发展,如何在琳琅满目的商品中给客户推荐针对性的商品,从而提高商品成交率成为当前的思考的重点。本文结合当前的大数据技术,提出一种基于数据挖掘的电子商务推荐系统,并对其实现进行了详细的探讨,从而为当前电子商务的发展提供参考。  相似文献   

