ISBN-13: 9786139504947 / Francuski
ISBN-13: 9786139504947 / Francuski
Au cours de la dernière décennie, le nombre de cas de plagiat a augmenté et est devenu un problème d'actualité dans le monde scientifique moderne, en raison de la quantité d'informations textuelles disponibles en ligne / hors ligne. Notre travail porte sur le développement d'un nouveau système de détection de plagiat prenant comme entrée les textes suspects (à analyser) et les textes originaux (base d'apprentissage). Il peut détecter les différentes formes de plagiat basées sur : Google API pour détecter les cas de plagiat avec traduction; résumé du texte pour détecter le plagiat d'idée, transformation conceptuelle pour détecter le plagiat avec synonymie; sac de phrases pour détecter le plagiat paraphrasé; l'algorithme d'abeilles travailleuses - social inspirant du style de vie des abeilles (butineur, gardien et nettoyeur) pour classer le texte suspect en plagiat ou sans classe de plagiat. Nos expériences ont été effectuées sur le jeu de données Pan09 et en utilisant les mesures de validation (rappel, précision, taux erreur, mesure f et entropie, taux succès).