Wikcionário:Esplanada/Arquivo/2014/Setembro

Acesso OAuth e inclusão sistemática de verbetes

Boa tarde,

A algum tempo estou querendo ajudar o Wikcionário com algo que eu acho que seria útil mas não sei como proceder. Atualmente temos uma boa parte dos verbos mas não temos a entrada das suas respectivas conjugações em muitos casos que pesquisei. Sou programador PHP a cerca de 10 anos e estou com a base de dados do Novo dicionário da língua portuguesa de Cândido de Figueiredo, que é livre. Gostaria de escrever um software para criar em formato de wiki todas as entradas conjugadas que eu não encontrei já registrado (para evitar sobrescrita), gostaria de desenvolver um APP e não um robô que se conecte utilizando o OAuth. As razões para isso são:

  • Criar uma plataforma externa para permitir a entrada de verbetes não existentes por terceiros sem conhecimento prévio de wiki;
  • Disponibilização do código fonte no Github;
  • Utilizar recursos de infraestrutura próprios, para evitar sobrecarga dos servidores da Wikimedia;
  • Adicionar sistematicamente a conjugação de todos os verbos não inseridos ainda.

Alguém poderia me indicar um norte?


Webysther Nunes (Discussão) 16h08min de 1 de setembro de 2014 (UTC)[responder]


Resolvi, encontrei nos seguintes URL's:

Vamos ver o que eu consigo fazer... :)

Webysther Nunes (Discussão) 19h56min de 1 de setembro de 2014 (UTC)[responder]

Olá Webysther Nunes. Muito legal sua ideia para completar as conjugações. Não costumo editar aqui no Wikicionário, mas mexo com robôs na Wikipédia e no Tool Labs. A primeira razão eu concordo que o OAuth é mais indicado, mas com robô você pode sim disponibilizar o código no GitHub, pode rodar o robô no Tool Labs, que é um servidor da Wikimedia que serve justamente para hospedar robôs e ferramentas web que auxiliam os projetos Wikimedia, e um robô pode verificar todos os verbos e completar as conjugações usando o banco de dados que você tem. No entanto qualquer tipo de contribuição é bem-vinda, independente do formato. Se quiser saber um pouco mais sobre robôs veja mw:Manual:Pywikibot, e sobre o Tool Labs veja wikitech:Nova Resource:Tools/Help. É muito bom também ver contribuições de programadores, que infelizmente ainda são poucos nos projetos lusófonos. Se precisar de ajuda com assuntos técnicos pode me encontrar no IRC. Bem-vindo e boas edições. Danilo.mac (Discussão) 22h16min de 1 de setembro de 2014 (UTC)[responder]
Vamos nos divertir, quando tiver novidades eu aviso. Atualmente estou fazendo no seguinte trabalho:
  • Levantar todos os dados de todos os dicionários livres ou em domínio público. Estou fuçando o Wikisource e vasculhando os dicionários digitais, inclusive enviando pedido para publicação usando o modelo de e-mail. Você já tem algum compilação de informação do tipo?
Eu tenho os seguintes comigo:
  • Minidicionário Livre da Língua Portuguesa - Manoel Mourivaldo Santiago-Almeida
  • Novo dicionário da língua portuguesa - Cândido de Figueiredo (versão atualizada de 2010 do projeto gutenberg)
Queria também durante a criação criar um algoritmo para conjugar todos os verbos.
Estou procurando também um dicionário fonético ou alguma fonte que faça conversão para X-SAMPA, por exemplo.
Um algoritmo para realizar a divisão silábica das palavras, encontrar a silaba tônica também. Webysther Nunes (Discussão) 12h18min de 4 de setembro de 2014 (UTC)[responder]
@Webysther: algum tempo atrás eu tentei esboçar alguma coisa nesse sentido (no console de JS do navegador), mas acabei esquecendo o rascunho de lado. Está incompleto e sem documentação, mas para o caso de servir para alguma coisa, colei o código em um Gist. Helder 14h24min de 4 de setembro de 2014 (UTC)[responder]
@Helder Obrigado, já favoritei e coloquei no meu checklist pessoal, existe algum material disponível para isso, mas atualmente estou fazendo um levantamento de todas as fontes disponíveis. :) Webysther Nunes (Discussão) 15h20min de 4 de setembro de 2014 (UTC)[responder]
Não tenho as conjugações, mas fiz esta query para listar os verbos sem conjugação, ela lista todas páginas que estão na categoria:Verbo (Português) e que não usam predefinição começadas por "conj.pt.", espero que ajude. Quanto ao algorítimo, acho que pode fazer um que verifica se o verbo tem um dos sufixos da predefinição conj.pt, o problema seria quando houver exceção à regra do sufíxo, por exemplo o particípio de verbos terminados por -ir pela regra termina com -ido, mas no verbo abrir o particípio é "aberto" e não "abrido", não sei como faria para identificar essas exceções, creio que essa será a a parte mais complicada. Danilo.mac (Discussão) 15h41min de 4 de setembro de 2014 (UTC)[responder]
Danilo.mac, se considerarmos o total de verbos da sua consulta e uma média de 40 flexões - conta de padeiro - temos como automatizar cerca de 64 mil entradas pelos próximos meses... Mas eu estava pensando, mesmo que um verbo tenha conjugação isso não significa que existe uma entrada para suas flexões, certo? Como temos cerca de 18 mil verbos, facilmente o wikcionário deveria ter mais de 1 milhão de entradas. É nisso que eu fico pensando quando eu vejo que temos 200 mil entradas. D:
Agora entendi melhor sua proposta inicial, como não edito por aqui eu não sabia que "entrada" era o termo usado para se referir a uma página do domínio principal. Não sei se é necessário uma entrada por flexão de verbo, tendo a achar que não, mas acho que ter tabela de conjugação completa de todos verbos seria muito importante para o Wikcionário. Danilo.mac (Discussão) 17h55min de 4 de setembro de 2014 (UTC)[responder]
Essa ideia faz parte de uma proposta mais abrangente, não sei se vocês (Helder, Danilo.mac) teriam interesse em ajudar na parte técnica. :)

Grants to improve your project

Apologies for English. Please help translate this message.

Greetings! The Individual Engagement Grants program is accepting proposals for funding new experiments from September 1st to 30th. Your idea could improve Wikimedia projects with a new tool or gadget, a better process to support community-building on your wiki, research on an important issue, or something else we haven't thought of yet. Whether you need $200 or $30,000 USD, Individual Engagement Grants can cover your own project development time in addition to hiring others to help you.


Proposta de Grande Dicionário da Língua Portuguesa
Se Alguém quiser ajudar a traduzir para inglês ou melhor o texto. :)
Webysther Nunes (Discussão) 15h05min de 4 de setembro de 2014 (UTC)[responder]

Encontro Wikimedia Ibero-Americano 2014

Colegas, O quarta edição do Encontro Wikimedia Ibero-Americano acontecerá em Buenos Aires, Argentina entre os dias 21 e 23 de novembro de 2014. O grupo brasileiro e o capítulo português têm cada um o direito de indicar dois participantes. A página para discussão sobre a delegação brasileira é WMBR:Encontro Wikimedia Ibero-Americano/2014. Sugiro que participe das discussões e, se tiver disponibilidade, indique seu nome como representante do nosso grupo. Há uma certa pressa na indicação dos nomes para a compra de passagens. Obrigado, Lechatjaune (Discussão) 01h22min de 4 de setembro de 2014 (UTC)[responder]

Change in renaming process

Part or all of this message may be in English. Please help translate if possible.

-- User:Keegan (WMF) (talk) 16h23min de 9 de setembro de 2014 (UTC)[responder]