INTELIGÊNCIA ARTIFICIAL E DIREITO: UMA SOLUÇÃO COMPUTACIONAL CAPAZ DE PREVER DECISÕES JUDICIAIS
Abstract
Neste trabalho, apresenta-se o resultado de uma solução computacional capaz de realizar a predição de sentenças. Classifica-se petições iniciais de ações civis públicas de improbidade administrativas e de execuções de termos de ajustamento de conduta, apresentadas pelo Ministério Público do Paraná (MPPR), nos anos de 2011 a 2018, perante as Varas Cíveis e da Fazenda Pública do Paraná. A finalidade das petições é prever sentenças judiciais (se favoráveis ou não em relação aos pedidos formulados pelos representantes do MPPR nas petições iniciais). Por meio de técnicas de processamento de linguagem natural e aprendizagem de máquina, os resultados obtidos foram promissores, atingindo 78,02% de acurácia com o uso de algoritmo indutor Logistic Regression, representação baseada em Bag of Words e uso de stemização RSLPS.
References
ALETRAS, N.; TSARAPATSANIS, D.; PREOŢIUC-PIETRO, D.; LAMPOS, V. Predicting Judicial Decisions of the European Court of Human Rights: A natural Language Processing Perspective. PeerJ Computer Science, PeerJ Inc., v. 2, 2016. Disponível em: https://peerj.com/articles/cs-93/. Acesso em: 27 mai. 2021.
ALTMAN, N. S. An Introduction to Kernel and Nearest-neighbor Nonparametric Regression. The American Statistician, v. 46, n. 3, pp. 175-185, 1992. Disponível em: www.jstor.org/stable/2685209. Acesso em: 27 mai. 2021.
BIRD, S. NLTK: The Natural Language Toolkit. Proceedings of the COLING/ACL 2006 Interactive Presentation Sessions, Association for Computational Linguistics, Sydney, Australia, 2006. Disponível em: https://doi.org/10.3115/1225403.1225421. Acesso em: 27 mai. 2021.
BOELLA, G.; CARO, L. Di; HUMPHREYS, L. Using Classification to Support Legal Knowledge Engineers in the Eunomos Legal Document Management System. Fifth International Workshop on Juris-informatics, JURISIN, 2011.
BRAZ, F. A.; SILVA, N. C. da; CAMPOS, T. E. de; CHAVES, F. B. de S.; FERREIRA, M. H. P.; INAZAWA, P. H. G.; COELHO, V. H. D.; SUKIENNIK, B. P.; ALMEIDA, A. P. G. S. de; VIDAL, F. B.; BEZERRA, D. A.; GUSMÃO, D. B.; ZIEGLER, G. G.; FERNANDES, R. V. de C.; ZUMBLICK, R.; PEIXOTO, F. H. Document Classification Using Abi-lstm to Unclog Brazil’s Supreme Court. Brasília, Brasil, 2018. Disponível em: https://cic.unb.br/~teodecampos/ViP/braz_etal_nips_ml4d_2018.pdf. Acesso em: 27 mai. 2021.
BREIMAN, L. Bagging Predictors. Machine Learning, v. 24, n. 2, pp. 123-140, 1996. Disponível em: https://doi.org/10.1007/BF00058655. Acesso em: 27 mai. 2021.
______. Random Forests. Machine Learning, v. 45, pp. 5-32, 2001. Disponível em: https://doi.org/10.1023/A:1010933404324. Acesso em: 27 mai. 2021.
CONSELHO NACIONAL DE JUSTIÇA. Relatório Justiça em Números 2020. Brasília, 2020. Disponível: https://www.cnj.jus.br/wp-content/uploads/2020/08/WEB-V3-Justi%C3%A7a-em-N%C3%BAmeros-2020-atualizado-em-25-08-2020.pdf. Acesso em: 27 mai. 2021.
CORTES, C.; VAPNIK, V. Support-vector Networks. Machine Learning, v. 20, pp. 273-297, 1995. Disponível: https://doi.org/10.1007/BF00994018. Acesso em: 27 mai. 2021.
DEMŠAR, J. Statistical Comparisons of Classifiers Over Multiple Data Sets. Journal of Machine Learning Research, v. 7, pp. 1-30, 2006. Disponível: https://www.jmlr.org/papers/volume7/demsar06a/demsar06a.pdf. Acesso em: 27 mai. 2021.
FERNANDES, R. V. de C.; CARVALHO, A. G. P. de. Tecnologia jurídica Direito Digital: II Congresso Internacional de Direito, Governo e Tecnologia – 2018. Belo Horizonte, Brasil: Fórum, 2018.
FRIEDMAN, M. The Use of Ranks to Avoid the Assumption of Normality Implicit in the Analysis of Variance. Journal of the American Statistical Association, Taylor & Francis, v. 32, n. 200, p. 675-701, 1937. Disponível: http://www.jstor.org/stable/2279372?origin=JSTOR-pdf. Acesso em: 27 mai. 2021.
HO, T. K. Random Decision Forests. Proceedings of the 3rd International Conference on Document Analysis and Recognition, Montreal, QC, pp. 278-282, 1995. Disponível: https://doi.ieeecomputersociety.org/10.1109/ICDAR.1995.598994. Acesso em: 27 mai. 2021.
HORNIK, K.; STINCHCOMBE, M.; WHITE, H. Multilayer Feedforward Networks are Universal Approximators. Neural Networks, v. 2, n. 5, pp. 359-366, 1989. Disponível: https://www.sciencedirect.com/science/article/pii/0893608089900208. Acesso em: 27 mai. 2021.
HOSMER, D. W.; LEMESHOW, S. Applied Logistic Regression. 2 ed. New York: Wiley. 2000. Disponível: http://resource.heartonline.cn/20150528/1_3kOQSTg.pdf. Acesso em: 27 mai. 2021.
JONES, K. S. A Statistical Interpretation of Term Specificity and its Application in Retrieval. Journal of Documentation, v. 28 n. 1, pp. 11-21, jan. 1972. Disponível: https://doi.org/10.1108/eb026526. Acesso em: 27 mai. 2021.
LIU, Z.; CHEN, H. A Predictive Performance Comparison of Machine Learning Models for Judicial Cases. 2017 IEEE Symposium Series on Computational Intelligence, SSCI, 2017. Disponível: https://ieeexplore.ieee.org/document/8285436. Acesso em: 27 mai. 2021.
NEMENYI, P. Distribution-free Multiple Comparisons. International Biome-Tric Soc, DC 20005-2210, v. 18, n. 2, p. 263, 1962.
OLIVEIRA, R. N. de; JUNIOR, M. C. Experimental Analysis of Stemming on Jurisprudential Documents Retrieval. Information, MDPI AG, v. 9, n. 2, 28, 2018. Disponível: https://doi.org/10.3390/info9020028. Acesso em: 27 mai. 2021.
ORENGO, V. M.; BURIOL, L. S.; COELHO, A. R. A Study on the Use of Stemming for Monolingual Ad-Hoc Portuguese Information Retrieval. In: Evaluation of Multilingual and Multi-Modal Information Retrieval. Springer Science & Business Media: Berlin, Germany, 2007. Disponível: https://doi.org/10.1007/978-3-540-74999-8_12. Acesso em: 27 mai. 2021.
ORENGO, V. M.; HUYCK, C. A Stemming Algorithm for the Portuguese Language. Proceedings of the Eighth International Symposium on String Processing and Information Retrieval, SPIRE 2001, Laguna de San Rafael, Chile, pp. 13–15, 2001; IEEE: Piscataway, NJ, USA, 2001, pp. 186-193. Disponível: https://doi.ieeecomputersociety.org/10.1109/SPIRE.2001.10024. Acesso em: 27 mai. 2021.
PDFMiner. Disponível em: https://pypi.org/project/pdfminer/. Acesso em: 20 mai. 2021.
PEDREGOSA, F.; VAROQUAUX, G.; GRAMFORT, A.; MICHEL, V.; THIRION, B.; GRISEL, O.; BLONDEL, M.; PRETTENHOFER, P.; WEISS, R.; DUBOURG, V.; VANDERPLAS, J.; PASSOS, A.; COURNAPEAU, D.; BRUCHER, M.; PERROT, M.; DUCHESNAY, E. Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research, v. 12, pp. 2825-2830, 2011. Disponível: https://www.jmlr.org/papers/volume12/pedregosa11a/pedregosa11a.pdf. Acesso em: 27 mai. 2021.
PORTER, M. F. An Algorithm for Suffix Stripping. Program, 1980.
PORTER, M. F. Snowball: A Language for Stemming Algorithms. 2001. Disponível: http://snowball.tartarus.org/texts/introduction.html. Acesso em: 27 mai. 2021.
PROJUDI – Processo Judicial Digital . Disponível em: https://projudi.tjpr.jus.br/projudi/. Acesso em: 28 jun. 2020.
RISH, I. An Empirical Study of the Naive Bayes Classifier. IJCAI 2001 Workshop on Empirical Methods in Artificial Intelligence, v. 3. n. 22, 2001. Disponível: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.330.2788&rep=rep1&type=pdf. Acesso em: 27 mai. 2021.
SAVOY, J. A Stemming Procedure and Stopword List for General French Corpora. J. Am. Soc. Inf. Sci., v. 50, pp. 944-952, 1999. Disponível: http://members.unine.ch/jacques.savoy/Papers/FRJasis.pdf. Acesso em: 27 mai. 2021.
SCHUSTER, M.; KULDIP K. P. Bidirectional Recurrent Neural Networks. IEEE Transactions on Signal Processing, v. 45, n. 11 pp. 2673-2681, 1997. Disponível: https://ieeexplore.ieee.org/document/650093. Acesso em: 27 mai. 2021.
SALTON, G.; WONG, A.; YANG, C. A Vector Space Model for Automatic Indexing. Communications of the ACM, v. 18, n. 11, pp. 613-620, 1975. Disponível: https://doi.org/10.1145/361219.361220. Acesso em: 27 mai. 2021.
SILVA, N. C. da; BRAZ, F. A.; CAMPOS, T. E. de; GUEDES, A. B. S.; MENDES, D. B.; BEZERRA, D. A.; GUSMÃO, D. B.; CHAVES, F. B. de S.; ZIEGLER, G. G.; HORINOUCHI, L. H.; FERREIRA, M. H. P.; INAZAWA, P. H. G.; COELHO, V. H. D.; FERNANDES, R. V. de C.; PEIXOTO, F. H.; FILHO, M. S. M.; SUKIENNIK, B. P.; ROSA, L. da S.; SILVA, R. Z. M. da; JUNQUILHO, T. A.; CARVALHO, G. H. T. A. Document Type Classificationfor Brazil’s Supreme Court Using a Convolutional Neural Network. The Tenth International Conference on Forensic Computer Science and Cyber Law, ICoFCS, São Paulo, Brasil, p. 7-11, 2018. Disponível: https://cic.unb.br/~teodecampos/ViP/correiaDaSilva_etal_icofcs2018.pdf. Acesso em: 27 mai. 2021.
ŞULEA, O. M.; ZAMPIERI, M.; MALMASI, S.; VELA, M.; DINU, L. P.; GENABITH, J. van. Exploring the Use of Text Classification in the Legal Domain. 2nd Workshop on Automated Semantic Analysis of Information in Legal Texts, London United Kingdom, 2017.
ŞULEA, O. M.; ZAMPIERI, M.; VELA, M.; GENABITH, J. van. Predicting the Law Area and Decisions of French Supreme Court Cases. Proceedings of the International Conference Recent Advances in Natural Language Processing, RANLP, 2017. Disponível: https://acl-bg.org/proceedings/2017/RANLP%202017/pdf/RANLP092.pdf. Acesso em: 27 mai. 2021.
TURING, A. M. Computing Machinery and Intelligence. Computers & Thought. Cambridge: MIT Press, pp. 11-35, 1995.
VAN RIJSBERGEN, C. J. Information Retrieval. 2 ed. Butterworth-Heinemann, 1979. Disponível: http://www.dcs.gla.ac.uk/Keith/Preface.html. Acesso em: 27 mai. 2021.
Copyright Notice
The submission of originals to this periodic implies in transference, by the authors, of the printed and digital copyrights/publishing rights. The copyrights for the published papers belong to the author, and the periodical owns the rights on its first publication. The authors will only be able to use the same results in other publications by a clear indication of this periodical as the one of its original publication. Due to our open access policy, it is allowed the free use of papers in the educational, scientific and non-commercial application, since the source is quoted (please, check the Creative Commons License on the footer area of this page).