Poisoned Texts

Un ejemplo de desarrollo informático para la detección del plagio y la caracterización del idiolecto discursivo

Palabras clave:

Plagio académico, idiolecto, programa informático

Resumen

Este artículo presenta una investigación de caso relacionada con dos áreas normalmente abordadas desde la Lingüística forense: la detección de plagio y la caracterización del estilo idiolectal. Desarrollado en el contexto universitario, el uso de un programa informático, Poisoned texts, sirve tanto para analizar el plagio como el estilo de un conjunto de 13 trabajos de estudiantes universitarios que son sospechosos de haber copiado un mismo texto fuente. Los resultados muestran que 6 estudiantes plagiaron un amplio número de largas secuencias textuales (n-gramas). En una segunda capa de análisis, el texto tomado como fuente manifiesta un estilo discursivo más completo y depurado que el utilizado por los estudiantes. En definitiva, este artículo, desde un estudio de caso real, expone una metodología de análisis del plagio y del idiolecto que combina tanto el apartado computacional como el interpretativo.

Descargas

La descarga de datos todavía no está disponible.

Altmetrics

Citas

Alfaro Torres, Paloma y Juan Juárez, Teresa de (2014): «El plagio académico: formar en competencias y buenas prácticas universitarias», RUIDERAe: Revista de Unidades de Información, 6, 1, pp. 1-20.

Anson, Daniel W. J. (2022): «Personas of plagiarism: the construction of the plagiarist in Australian university subreddits», Linguistics and Education, 69, pp. 1-12, https://doi.org/10.1016/j.linged.2022.101050.

Anthony, Laurence (2022): AntConc, Tokio, Waseda University, http://www.laurenceanthony.net/software/antconc/.

Barrón Cedeño, Alberto (2014): «Software para la detección de plagio académico», en R. Comas Forgas y J. Sureda Negre (coord.), El plagio académico en Educación Secundaria: características del fenómeno y estrategias de intervención, Palma, Grupo de investigación de la Universidad de las Islas Baleares, pp. 85-100.

Bloch, Bernard (1948): «A Set of Postulates for Phonemic Analysis», Language 24, 1, pp. 3-46, https://doi.org/10.2307/410284.

Bloomfield, Lou (2016): Wcopyfind, https://plagiarism.bloomfieldmedia.com/.

Cabedo Nebot, Adrián (2021): Fundamentos de estadística con R para lingüistas, Valencia, Tirant Lo Blanch.

Cabedo Nebot, Adrián (2022): Poisoned Texts, https://github.com/acabedo/poisonedtexts.

Cayuela Mateo, Ana; Tauste Francés, Ana; Seguí Crespo, Mar; Esteve Faubel, José María y Ronda Pérez, Elena (2015): «¿Cómo medir el plagio entre alumnos universitarios?: Revisión de instrumentos utilizados en artículos científicos», en María Teresa Tortosa Ybáñez, José Daniel Álvarez Teruel y Neus Pellín Buades (coords.), XIII Jornadas de Redes de Investigación en Docencia Universitaria: nuevas estrategias organizativas y metodológicas en la formación universitaria para responder a la necesidad de adaptación y cambio, Alicante, Universidad de Alicante, pp. 210-216.

Cebrián Robles, Violeta (2020): Estudio sobre el plagio en las facultades de educación. tesis doctoral dirigda por Manuela Raposo Rivas, Vigo, Universidad de Vigo.

Chang, Winston; Cheng, Joe; Allaire, JJ.; Sievert, Carson; Schloerke, Barret; Xie, Yihui; Allen, Jeff; McPherson, Jonathan; Dipert, Alan; y Borges, Barbara (2021): «Shiny: Web Application Framework for R», https://CRAN.R-project.org/package=shiny.

Cicres i Bosch, Jordi y Gavaldà, Núria (2014): «La lingüística forense: la llengua com a evidència», Revista de llengua i dret, 61, pp. 60-71.

Código Penal (Ley Orgánica 10/1995, de 23 de Noviembre), 1995, Noviembre. https://vlex.es/vid/ley-organica-codigo-penal-126987.

Coulthard, Malcolm; Johnson, Alison; Kredens, Krzysztof y Wools David (2010): «Plagiarism Four forensic linguists’ responses to suspected plagiarism», en Malcolm Coulthard y Alison Johnson (eds.), The Routledge Handbook of Forensic Linguistics, Londrés, Routledge (col. Routledge Handbooks in Applied Linguistics), pp. 523-538.

Díaz Arce, Dariel (2016): «Plagio académico en estudiantes de bachillerato: ¿qué detecta TURNITIN?». RUIDERAe: Revista de unidades de información, 9, pp. 1-31.

Eret, Esra y Gokmenoglu, Tuba (2010): «Plagiarism in higher education: a case study with prospective academicians», Procedia - Social and Behavioral Sciences, Innovation and Creativity in Education, 2, 2, pp. 3303-3307, https://doi.org/10.1016/j.sbspro.2010.03.505.

Fernández-Ordóñez, Inés (2016): «Dialectos del Español Peninsular», en Javier Gutiérrez Rexach (ed.), Enciclopedia de Lingüística Hispánica, Londres, Routledge, pp. 387-404.

Grant, Tim (2010): «Text Messaging Forensics Txt 4n6: Idiolect Free Authorship Analysis?», en Malcolm Coulthard y Alison Johnson (eds.), The Routledge Handbook of Forensic Linguistics, Londres, Routledge (col. Routledge Handbooks in Applied Linguistics), pp. 508-522.

Kiss, András Károly (2013): «Loopholes of Plagiarism Detection Software», en Aytekin Isman, Colleen Sexton, Teresa Franklin, Ahmet Eskicumali (ed.), Procedia - Social and Behavioral Sciences, 4th International Conference on New Horizons in Education, 106 (diciembre), pp. 1796-1803, https://doi.org/10.1016/j.sbspro.2013.12.202.

Law, Lily; Ting, Su-Hie y Jerome, Collin (2013): «Cognitive dissonance in dealing with plagiarism in academic writing», en Chee Siong Teh, Hee-Rahk Chae, Shahren Ahmad Zaidi Adruce, Philip Nuli Anding, Chwen Jen Chen, Norazila Abd Aziz, Kock Wah Tan (ed.), Procedia - Social and Behavioral Sciences, The 9th International Conference on Cognitive Science, 97 (noviembre), pp. 278-284, https://doi.org/10.1016/j.sbspro.2013.10.234.

Ley de propiedad intelectual, regularizando, aclarando y armonizando las disposiciones legales vigentes sobre la materia (Real Decreto Legislativo 1/1996, de 12 de Abril)», 1996, abril. http://vlex.com/vid/regularizando-aclarando-armonizando-127567.

Lukashenko, Romans; Graudina, Vita y Grundspeņķis, Janis (2007): «Computer-Based plagiarism detection methods and tools: an overview», en Boris Rachev, Angel Smrikarov y Dimo Dimov (ed.), Proceedings of the 2007 International Conference on Computer Systems and Technologies, Rousse, Bulgaria, Association for Computing Machinery, pp. 1-6, https://doi.org/10.1145/1330598.1330642.

McMenamin, Gerald R. (1993): Forensic stylistics, Ámsterdam, Elsevier.

Morey López, Mercedes; Sureda Negre, Jaume; Oliver Trobat, Miquel Francesc y Comas Forgas, Rubén Lluc (2013): «Plagio y rendimiento académico entre el alumnado de Educación Secundaria Obligatoria», ESE: Estudios sobre educación, 24, pp. 225-244.

Ochoa Sierra, Ligia y Cueva, Alberto (2016): «Percepciones de estudiantes acerca del plagio: datos cualitativos», Encuentros 14, 2, pp. 25-41.

R Core Team. 2022. R: A language and environment for statistical computing, Viena, Austria, R Foundation for Statistical Computing, https://www.R-project.org/.

Ronda Pérez, Elena; Seguí Crespo, Mar; Cayuela Mateo, Ana; Tauste Francés, Ana; Lumbreras Lacarra, Blanca y Esteve Faubel, José María (2016): «RedPlag: el plagio en los trabajos docentes de los estudiantes universitarios», en José Daniel Álvarez Teruel, Salvador Grau Company y María Teresa Tortosa Ybáñez (coords.), Innovaciones metodológicas en docencia universitaria: resultados de investigación, San Vicente de Raspeig, Universidad de Alicante, pp. 633-648.

Sheard, Judy, Markham, Selby y Dick, Martin (2003): «Investigating differences in cheating behaviours of IT undergraduate and graduate students: the maturity and motivation factors», Higher Education Research & Development, 22, pp. 91-108, https://doi.org/10.1080/0729436032000056526.

STS 1204/2008, 18 de diciembre de 2008. http://vlex.com/vid/intelectual-sistema-informatico-datos-52043815.

Sun, Yu-Chih (2013): «Do journal authors plagiarize? Using plagiarism detection software to uncover matching text across disciplines», Journal of English for Academic Purposes, 12, 4, pp. 264-272, https://doi.org/10.1016/j.jeap.2013.07.002.

Sureda Negre, Jaume y Comas Forgas, Rubén Lluc (2006): «Ciber-Plagio académico. Una aproximación al estado de los conocimientos», Textos de la CiberSociedad, 10, pp. 1-6.

Sureda Negre, Jaume; Comas Forgas, Rubén Lluc y Morey López, Mercedes (2009): «Las causas del plagio académico entre el alumnado universitario según el profesorado», Revista Iberoamericana de Educación 50, 1, pp. 197-220.

Wijffels, Jan (2022): «Udpipe: Tokenization, Parts of Speech Tagging, Lemmatization and Dependency Parsing with the ’UDPipe’ ’NLP’ Toolkit», https://CRAN.R-project.org/package=udpipe.

Woolls, David (2010): «Computational Forensic Linguistics searching for similarity in large specialised corpora», en Malcolm Coulthard y Alison Johnson (eds.), The Routledge Handbook of Forensic Linguistics (col. Routledge Handbooks in Applied Linguistics), Londres, Routledge, pp. 576-590.

Wright, David (2017): «Using word n-grams to identify authors and idiolects: a corpus approach to a forensic linguistic problem», International Journal of Corpus Linguistics, 22, 2, pp. 212-241, https://doi.org/10.1075/ijcl.22.2.03wri.

Publicado
2023-09-14
Cómo citar
Cabedo Nebot, A. (2023). Poisoned Texts: Un ejemplo de desarrollo informático para la detección del plagio y la caracterización del idiolecto discursivo. Del Español. Revista de Lengua, 1, 233-258. https://doi.org/10.33776/dlesp.v1.7922
Sección
Monográfico