Wikcionário:Esplanada/Arquivo/2014/Dezembro
Novos Verbetes, +500mil
Não sei se alguém lembra de mim, eu estava perguntando a alguns meses sobre processo de automatização para inclusão de novas verbetes.... Enfim, eu desapareci para trabalhar nisso, tive muitos problemas e gostaria de listar os principais e como eu consegui essa quantidade gigantesca de verbetes com qualidade.
- Fiz um levantamento realizando o cruzamento dos dados do [VOLP da ABL] (fiz a filtragem semi-automatizada de todos os verbos), do [Conjugação] (conjugação dos verbos para ter uma lista de todas as verbetes) e do [Dicionário Aberto] (significado de muitos verbos)
Proposta
Eu queria colocar todas os verbos com todos os significados que eu encontrar em um dicionário livre (logo todos os verbos não podem ser simplesmente adicionados) e sua respectiva verbete de conjugação, por exemplo comerem, que fala sobre sua flexão e leva o usuário para o verbo de origem, isso é muito importante para permitir a pessoa encontrar na busca e a relação - por vezes não óbvia - de um verbo.
Verbos
- Existe uma lista do IME-USP com ~5mil verbos, tendo em vista que temos mais de 20mil, agora com o levantamento, temos exatamente 20562 verbos formais. Vou trabalhar para entregar esses dados para o pessoal da USP.
Significado dos Verbos
- Utilizei os dados do dicionário livre e também do [dicionário web] que por força de licença também é livre, qualquer entrada que já existe aqui (eu já fiz isso) não será incluída por questão de segurança e principalmente complexidade.
Conjugação dos Verbos
- Utilizei o conjugue e com isso a quantidade de registros aumentou muito, com cerca de 50 novas verbetes para cada verbo.
Critérios de exclusão
Aqui está a lista de todos as regras que foram utilizadas para excluir verbetes dessa listagem:
- Verbo/conjugação já existe aqui
- Verbo sem significado
Próximos Passos
- Esse presente de natal vai começar a ser incluído através da API pelos próximos dias, monitorem o meu usuário e caso apareça algum erro muito grande me reportem, inicialmente vou adicionar apenas 5 por dia e vou aumentando quando estiver completamente estável. A idéia é finalizar em até duas semanas.
Futuro
- As verbetes sem dados em dicionários livres eu vou começar a pesquisar em outros dicionários manualmente e criar um texto consolidado.
Fontes
Foi necessário realizar diversas aquisições e ter em mãos vários dicionários para pesquisas, fiz isso por acreditar muito no mundo livre e para resolver meus problemas com o Português, não sou bom nele e isso foi uma forma de unir o útil ao agradável, a compreensão será bem vinda.
- VOLP Edição 2009
- Dicionário da Língua Portuguesa Medieval
- Dicionário escolar da língua portuguesa - ABL
- Houaiss
Feliz Natal! HO HO HO — Webysther Nunes (Discussão) 21h58min de 25 de dezembro de 2014 (UTC)
Comentário do Valdir
Olá Nunes!
Perdoe-me a franqueza, mas me dá um frio na espinha a ideia de alguém adicionar meio milhão de verbetes automaticamente ao nosso projeto; e mais ainda em um período de tempo tão curto assim; e ainda mais considerando o fato de que você mesmo diz ter problemas com o português. A menos que isto seja feito com muito, muito cuidado, ao invés de ser um "presente de Natal" como você diz, vai terminar sendo um pesadelo gigantesco para nós que trabalhamos aqui regularmente.
Que tal você criar uma meia dúzia de verbetes, deixar os contribuidores regulares analisarem esses verbetes e aí sim, poderia começar, bem devagar a criar esses verbetes? Dessa forma, se o seu programa tiver algum problema, nós teríamos que cuidar de só um punhado de verbetes e não de milhares.
Outra coisa: que tal criar primeiro os verbetes "canônicos" na mão e só depois criar as flexões correspondentes? Se não, essas flexões ficariam "órfãs", o que é um grande problema para nós.
No fim das contas, o meu pedido principal para você é: por favor, vamos bem devagar com o andor, pois o santo é de barro!
--Valdir Jorge fala!
00h57min de 26 de dezembro de 2014 (UTC)
Olá Valdir!
Que isso! Você está completamente certo. Estou criando a exportação e vou levantar um servidor para vocês conferirem os dados em formato tabular ou algo parecido. Apesar dos dados serem bastante sistematizáveis, não existe código a prova de falhas, é possível minimizá-lo. Atualmente já foi criado no meu ambiente local cerca de 140mil novos verbetes que não existem aqui e ainda está na letra "b". — Webysther Nunes (Discussão) 17h26min de 26 de dezembro de 2014 (UTC)
No caso dos verbetes principais, já estou realizando uma busca sobre o significado em uma das fontes citadas, após conversão do formato wiki deles e conversão para o nosso formato, vou fazer a geração no meu ambiente e ir criando na mão, se estiver tudo certo, ai combinamos de fazer a importação diretamente. Acho que assim todo mundo fica menos tenso, não acha? — Webysther Nunes (Discussão) 17h31min de 26 de dezembro de 2014 (UTC)
Legibilidade
Nunca é demais perguntar, então, a respeito do modelo de tradução dos textos exemplos em outros idiomas que vai sotoposto às definições, o fato de a fonte estar pequena não vai atrapalhar a legibilidade? A fonte normal das definições é legível, normal, mas já não é tão grande assim, sei que pôr a fonte das traduções desses textos exemplos em tamanho maior pode (e vai) fazer as páginas serem maiores verticalmente, mas ainda assim não haveria outra composição possível? Exemplo, só exemplo, acho que nem seria possível fazer, pôr as fontes em tamanho normal como das definições e texto inclinado à esquerda, ou outra coisa que fosse possível? --Kaleb Alkbashr (Discussão) 23h11min de 21 de outubro de 2014 (UTC)
- Particularmente, não penso que o fato de a fonte estar pequeno vá atrapalhar a legibilidade. Não é tão pequena assim, na minha opinião. Mas de qualquer maneira, estaria disposto a considerar outras opções.
- --Valdir Jorge fala!
11h18min de 15 de dezembro de 2014 (UTC)
- Eita, meio ruinzinho de ler, é que eu estou curto de ideias, a única que consigo "lembrar" e que já vi por uns verbetes é não usar a etiqueta de marcação small, ficavam entre parênteses normal, não me vem ideias de como fazer uma formatação que faça ficar diferente da definição e do exemplo ao mesmo tempo (pensei até em fonte inclinada à esquerda (mas isso acho que nem dá ou seria praticável e poderia ficar esquisito um texto p'ra esquerda um p'ra direita)) --Kaleb Alkbashr (Discussão) 15h46min de 18 de dezembro de 2014 (UTC)
- Se estiver curto de ideias, vá dar uma olhada como é feito nos outros Wikcionários. Veja, por exemplo, como é feito no en:wikt e no fr:wikt.
- Particularmente não gosto de nenhuma dessas duas opções, prefiro a nossa como está, mas se mais gente preferir de outra maneira, sempre podemos conversar a respeito.
- --Valdir Jorge fala!
16h22min de 18 de dezembro de 2014 (UTC)
- Então tá bem, se alguém mais preferir de outra maneira, a gente conversa mais, prefiro o nosso modo, é melhor (só o que pega um pouco é o tamanho), aquela do wikt-fr faz perder na minha opinião a correlação visual de texto a ser traduzido com o texto tradução (eu acho que se eles colocassem colchetes na tradução até era bonzinho, não sei porquê, mas acho), e o do wikt-en mistura um sinal de pontuação como separador, pior que a língua deles é feita das outras, vai-se embagulhando tudo junto e sem padrão, não dá para dizer o que é o quê, aquele itálico ali não é suficiente não, lendo a expressão exemplo de uso fica com aparência de estar tudo numa língua só se tiver tudo em letras latinas, como se fosse duas falas de uma conversa, uma como que reportada pela fala do "locutor" da frase, imagino que fica pior se a frase de exemplo de uso for começada com um travessão, o como que não fica parecendo com uma tradução começada com travessão, separada por travessão, ou talvez seja só impressão minha; insular a tradução aqui foi uma boa pedida, realmente, analisando bem.--Kaleb Alkbashr (Discussão) 17h46min de 18 de dezembro de 2014 (UTC)
Problema, entradas nas páginas listadoras de categoria
As palavras nas páginas listadoras de categoria estão fora de ordem alfabética, as palavras com acento vão lá depois no final de todas as outras no encadeamento daquelas começada com uma dada letra, tem alguma coisa que dê para fazer/se possa fazer? --Kaleb Alkbashr (Discussão) 18h39min de 29 de novembro de 2014 (UTC)
- Talvez possamos usar a predefinição {{DEFAULTSORT:<sort key>}} --• Diogo P. Duarte • (Discussão) 14h59min de 13 de dezembro de 2014 (UTC)
- O uso de DEFAULTSORT obrigaria que mudássemos isso em cada verbete, um trabalho sem fim. Imagino que deva haver uma maneira "sistêmica" de consertar isso, mas não faço ideia qual seja. Talvez seria o caso de se perguntar no MediaWiki...
- --Valdir Jorge fala!
11h18min de 15 de dezembro de 2014 (UTC)
Por que não termos "Verbete em destaque"?
Olás,
gostaria de sugerir a criação de uma seção na página principal do Wikcionário para destacar verbetes. Assim como a Wikipédia tem o "Artigo em destaque", que sempre nos mostra alguma coisa que foi considerada de melhor qualidade, poderíamos ter o mesmo no Wikicionário.
Imagino que a existência dos verbetes em destaque poderia servir de incentivo e também como exemplos daquilo que é esperado dos verbetes de melhor qualidade possuirem. O conteúdo, a organização, as formatações, ... cada detalhe pode ser mostrado de forma mais prática para todos.
A opção "entrada aleatória" do menu, é, como o nome diz, aleatória. Mas infelizmente o wikicionário em português ainda está com uma qualidade abaixo do que espero dele em muitos artigos. E encontrar um verbete modelo/exemplo para algo usando artigos aleatórios não funciona muito bem.
Acho que a documentação e as páginas de ajuda que também existem podem até estar completas, mas acho muito difícil usá-las quando quero encontrar rapidamente um detalhe ou outro - deixo de lado, desisto, espero que alguém melhore depois se precisar, e provavelmente é alguém que fará isso sem precisar consultar a ajuda como eu tentei fazer.
O que acham?
Existe alguém lendo isso aqui?
Existe alguém lendo isso aqui?
- Olá Rapidim!
- Penso que sua pergunta original (Por que não termos "Verbete em destaque"?) já se respondeu, não é mesmo? Por falta de interesse da comunidade. Ninguém nem se dignou a responder sua pergunta, não acho que teríamos quem mantivesse essa página atualizada.
- No passado já tivemos gente propondo isso, mas o projeto não deu frutos exatamente por falta de interesse. E olhe que na época a comunidade do projeto era bem mais forte do que é hoje...
- --Valdir Jorge fala!
11h18min de 15 de dezembro de 2014 (UTC)
- Oi, Valdir.
- Acho que colocar isso em prática pode incentivar as coisas a mudarem pra melhor, não? Imagino que manter a página atualizada é algo muito simples! Eu me candidato a fazer isso (e imagino que existam pessoas com um número maior de contribuições que tenho hoje nesse usuário, e também com um conhecimento maior que o meu em toda a estrutura do projeto; mas estou aberto, se algum administrador quiser conversar comigo).
- Uma atualização a cada 15 dias pra começar, não tomaria tempo de ninguém. Uma vez por semana é melhor, se existirem verbetes (de qualidade destacável) suficientes.
- Olá Rapidim!
- Bem, se você se dispõe a mantê-la atualizada, vá em frente!
- --Valdir Jorge fala!
19h28min de 15 de dezembro de 2014 (UTC)
- Olá de novo!
- Nós já discutimos esse assunto no passado, um outro contribuidor (que não está mais ativo) até criou uma página para palavras em destaque. Se quiser comerçar por aí, já é parte do caminho andado...
- --Valdir Jorge fala!
16h56min de 16 de dezembro de 2014 (UTC)
- Vou dar uma lida (melhor, fiz isso meio rápido agora) e uma pesquisada no que já foi feito/tentado. E volto a falar aqui.
- Minhas dificuldades práticas são o uso do MediaWiki pra isso. Nunca fiz nem vi a fundo, apesar de eu ter um bom conhecimento técnico em assuntos próximos, que com certeza pode ajudar nisso.
- --Rapidim (Discussão) 18h42min de 19 de dezembro de 2014 (UTC)