INTELIGÊNCIA ARTIFICIAL E DIREITO: UMA SOLUÇÃO COMPUTACIONAL CAPAZ DE PREVER DECISÕES JUDICIAIS
Resumo
Neste trabalho, apresenta-se o resultado de uma solução computacional capaz de realizar a predição de sentenças. Classifica-se petições iniciais de ações civis públicas de improbidade administrativas e de execuções de termos de ajustamento de conduta, apresentadas pelo Ministério Público do Paraná (MPPR), nos anos de 2011 a 2018, perante as Varas Cíveis e da Fazenda Pública do Paraná. A finalidade das petições é prever sentenças judiciais (se favoráveis ou não em relação aos pedidos formulados pelos representantes do MPPR nas petições iniciais). Por meio de técnicas de processamento de linguagem natural e aprendizagem de máquina, os resultados obtidos foram promissores, atingindo 78,02% de acurácia com o uso de algoritmo indutor Logistic Regression, representação baseada em Bag of Words e uso de stemização RSLPS.
Referências
ALETRAS, N.; TSARAPATSANIS, D.; PREOŢIUC-PIETRO, D.; LAMPOS, V. Predicting Judicial Decisions of the European Court of Human Rights: A natural Language Processing Perspective. PeerJ Computer Science, PeerJ Inc., v. 2, 2016. Disponível em: https://peerj.com/articles/cs-93/. Acesso em: 27 mai. 2021.
ALTMAN, N. S. An Introduction to Kernel and Nearest-neighbor Nonparametric Regression. The American Statistician, v. 46, n. 3, pp. 175-185, 1992. Disponível em: www.jstor.org/stable/2685209. Acesso em: 27 mai. 2021.
BIRD, S. NLTK: The Natural Language Toolkit. Proceedings of the COLING/ACL 2006 Interactive Presentation Sessions, Association for Computational Linguistics, Sydney, Australia, 2006. Disponível em: https://doi.org/10.3115/1225403.1225421. Acesso em: 27 mai. 2021.
BOELLA, G.; CARO, L. Di; HUMPHREYS, L. Using Classification to Support Legal Knowledge Engineers in the Eunomos Legal Document Management System. Fifth International Workshop on Juris-informatics, JURISIN, 2011.
BRAZ, F. A.; SILVA, N. C. da; CAMPOS, T. E. de; CHAVES, F. B. de S.; FERREIRA, M. H. P.; INAZAWA, P. H. G.; COELHO, V. H. D.; SUKIENNIK, B. P.; ALMEIDA, A. P. G. S. de; VIDAL, F. B.; BEZERRA, D. A.; GUSMÃO, D. B.; ZIEGLER, G. G.; FERNANDES, R. V. de C.; ZUMBLICK, R.; PEIXOTO, F. H. Document Classification Using Abi-lstm to Unclog Brazil’s Supreme Court. Brasília, Brasil, 2018. Disponível em: https://cic.unb.br/~teodecampos/ViP/braz_etal_nips_ml4d_2018.pdf. Acesso em: 27 mai. 2021.
BREIMAN, L. Bagging Predictors. Machine Learning, v. 24, n. 2, pp. 123-140, 1996. Disponível em: https://doi.org/10.1007/BF00058655. Acesso em: 27 mai. 2021.
______. Random Forests. Machine Learning, v. 45, pp. 5-32, 2001. Disponível em: https://doi.org/10.1023/A:1010933404324. Acesso em: 27 mai. 2021.
CONSELHO NACIONAL DE JUSTIÇA. Relatório Justiça em Números 2020. Brasília, 2020. Disponível: https://www.cnj.jus.br/wp-content/uploads/2020/08/WEB-V3-Justi%C3%A7a-em-N%C3%BAmeros-2020-atualizado-em-25-08-2020.pdf. Acesso em: 27 mai. 2021.
CORTES, C.; VAPNIK, V. Support-vector Networks. Machine Learning, v. 20, pp. 273-297, 1995. Disponível: https://doi.org/10.1007/BF00994018. Acesso em: 27 mai. 2021.
DEMŠAR, J. Statistical Comparisons of Classifiers Over Multiple Data Sets. Journal of Machine Learning Research, v. 7, pp. 1-30, 2006. Disponível: https://www.jmlr.org/papers/volume7/demsar06a/demsar06a.pdf. Acesso em: 27 mai. 2021.
FERNANDES, R. V. de C.; CARVALHO, A. G. P. de. Tecnologia jurídica Direito Digital: II Congresso Internacional de Direito, Governo e Tecnologia – 2018. Belo Horizonte, Brasil: Fórum, 2018.
FRIEDMAN, M. The Use of Ranks to Avoid the Assumption of Normality Implicit in the Analysis of Variance. Journal of the American Statistical Association, Taylor & Francis, v. 32, n. 200, p. 675-701, 1937. Disponível: http://www.jstor.org/stable/2279372?origin=JSTOR-pdf. Acesso em: 27 mai. 2021.
HO, T. K. Random Decision Forests. Proceedings of the 3rd International Conference on Document Analysis and Recognition, Montreal, QC, pp. 278-282, 1995. Disponível: https://doi.ieeecomputersociety.org/10.1109/ICDAR.1995.598994. Acesso em: 27 mai. 2021.
HORNIK, K.; STINCHCOMBE, M.; WHITE, H. Multilayer Feedforward Networks are Universal Approximators. Neural Networks, v. 2, n. 5, pp. 359-366, 1989. Disponível: https://www.sciencedirect.com/science/article/pii/0893608089900208. Acesso em: 27 mai. 2021.
HOSMER, D. W.; LEMESHOW, S. Applied Logistic Regression. 2 ed. New York: Wiley. 2000. Disponível: http://resource.heartonline.cn/20150528/1_3kOQSTg.pdf. Acesso em: 27 mai. 2021.
JONES, K. S. A Statistical Interpretation of Term Specificity and its Application in Retrieval. Journal of Documentation, v. 28 n. 1, pp. 11-21, jan. 1972. Disponível: https://doi.org/10.1108/eb026526. Acesso em: 27 mai. 2021.
LIU, Z.; CHEN, H. A Predictive Performance Comparison of Machine Learning Models for Judicial Cases. 2017 IEEE Symposium Series on Computational Intelligence, SSCI, 2017. Disponível: https://ieeexplore.ieee.org/document/8285436. Acesso em: 27 mai. 2021.
NEMENYI, P. Distribution-free Multiple Comparisons. International Biome-Tric Soc, DC 20005-2210, v. 18, n. 2, p. 263, 1962.
OLIVEIRA, R. N. de; JUNIOR, M. C. Experimental Analysis of Stemming on Jurisprudential Documents Retrieval. Information, MDPI AG, v. 9, n. 2, 28, 2018. Disponível: https://doi.org/10.3390/info9020028. Acesso em: 27 mai. 2021.
ORENGO, V. M.; BURIOL, L. S.; COELHO, A. R. A Study on the Use of Stemming for Monolingual Ad-Hoc Portuguese Information Retrieval. In: Evaluation of Multilingual and Multi-Modal Information Retrieval. Springer Science & Business Media: Berlin, Germany, 2007. Disponível: https://doi.org/10.1007/978-3-540-74999-8_12. Acesso em: 27 mai. 2021.
ORENGO, V. M.; HUYCK, C. A Stemming Algorithm for the Portuguese Language. Proceedings of the Eighth International Symposium on String Processing and Information Retrieval, SPIRE 2001, Laguna de San Rafael, Chile, pp. 13–15, 2001; IEEE: Piscataway, NJ, USA, 2001, pp. 186-193. Disponível: https://doi.ieeecomputersociety.org/10.1109/SPIRE.2001.10024. Acesso em: 27 mai. 2021.
PDFMiner. Disponível em: https://pypi.org/project/pdfminer/. Acesso em: 20 mai. 2021.
PEDREGOSA, F.; VAROQUAUX, G.; GRAMFORT, A.; MICHEL, V.; THIRION, B.; GRISEL, O.; BLONDEL, M.; PRETTENHOFER, P.; WEISS, R.; DUBOURG, V.; VANDERPLAS, J.; PASSOS, A.; COURNAPEAU, D.; BRUCHER, M.; PERROT, M.; DUCHESNAY, E. Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research, v. 12, pp. 2825-2830, 2011. Disponível: https://www.jmlr.org/papers/volume12/pedregosa11a/pedregosa11a.pdf. Acesso em: 27 mai. 2021.
PORTER, M. F. An Algorithm for Suffix Stripping. Program, 1980.
PORTER, M. F. Snowball: A Language for Stemming Algorithms. 2001. Disponível: http://snowball.tartarus.org/texts/introduction.html. Acesso em: 27 mai. 2021.
PROJUDI – Processo Judicial Digital . Disponível em: https://projudi.tjpr.jus.br/projudi/. Acesso em: 28 jun. 2020.
RISH, I. An Empirical Study of the Naive Bayes Classifier. IJCAI 2001 Workshop on Empirical Methods in Artificial Intelligence, v. 3. n. 22, 2001. Disponível: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.330.2788&rep=rep1&type=pdf. Acesso em: 27 mai. 2021.
SAVOY, J. A Stemming Procedure and Stopword List for General French Corpora. J. Am. Soc. Inf. Sci., v. 50, pp. 944-952, 1999. Disponível: http://members.unine.ch/jacques.savoy/Papers/FRJasis.pdf. Acesso em: 27 mai. 2021.
SCHUSTER, M.; KULDIP K. P. Bidirectional Recurrent Neural Networks. IEEE Transactions on Signal Processing, v. 45, n. 11 pp. 2673-2681, 1997. Disponível: https://ieeexplore.ieee.org/document/650093. Acesso em: 27 mai. 2021.
SALTON, G.; WONG, A.; YANG, C. A Vector Space Model for Automatic Indexing. Communications of the ACM, v. 18, n. 11, pp. 613-620, 1975. Disponível: https://doi.org/10.1145/361219.361220. Acesso em: 27 mai. 2021.
SILVA, N. C. da; BRAZ, F. A.; CAMPOS, T. E. de; GUEDES, A. B. S.; MENDES, D. B.; BEZERRA, D. A.; GUSMÃO, D. B.; CHAVES, F. B. de S.; ZIEGLER, G. G.; HORINOUCHI, L. H.; FERREIRA, M. H. P.; INAZAWA, P. H. G.; COELHO, V. H. D.; FERNANDES, R. V. de C.; PEIXOTO, F. H.; FILHO, M. S. M.; SUKIENNIK, B. P.; ROSA, L. da S.; SILVA, R. Z. M. da; JUNQUILHO, T. A.; CARVALHO, G. H. T. A. Document Type Classificationfor Brazil’s Supreme Court Using a Convolutional Neural Network. The Tenth International Conference on Forensic Computer Science and Cyber Law, ICoFCS, São Paulo, Brasil, p. 7-11, 2018. Disponível: https://cic.unb.br/~teodecampos/ViP/correiaDaSilva_etal_icofcs2018.pdf. Acesso em: 27 mai. 2021.
ŞULEA, O. M.; ZAMPIERI, M.; MALMASI, S.; VELA, M.; DINU, L. P.; GENABITH, J. van. Exploring the Use of Text Classification in the Legal Domain. 2nd Workshop on Automated Semantic Analysis of Information in Legal Texts, London United Kingdom, 2017.
ŞULEA, O. M.; ZAMPIERI, M.; VELA, M.; GENABITH, J. van. Predicting the Law Area and Decisions of French Supreme Court Cases. Proceedings of the International Conference Recent Advances in Natural Language Processing, RANLP, 2017. Disponível: https://acl-bg.org/proceedings/2017/RANLP%202017/pdf/RANLP092.pdf. Acesso em: 27 mai. 2021.
TURING, A. M. Computing Machinery and Intelligence. Computers & Thought. Cambridge: MIT Press, pp. 11-35, 1995.
VAN RIJSBERGEN, C. J. Information Retrieval. 2 ed. Butterworth-Heinemann, 1979. Disponível: http://www.dcs.gla.ac.uk/Keith/Preface.html. Acesso em: 27 mai. 2021.
A submissão de originais para este periódico implica na transferência, pelos autores, dos direitos de publicação impressa e digital. Os direitos autorais para os artigos publicados são do autor, com direitos do periódico sobre a primeira publicação. Os autores somente poderão utilizar os mesmos resultados em outras publicações indicando claramente este periódico como o meio da publicação original. Em virtude de sermos um periódico de acesso aberto, permite-se o uso gratuito dos artigos em aplicações educacionais, científicas, não comerciais, desde que citada a fonte (por favor, veja a Licença Creative Commons no rodapé desta página).