Monday, 19 March 2018

Opções de estoque da udacity

opções de estoque de Udacity
"data-share-img =" "data-share =" twitter, facebook, linkedin, reddit, google, mail "data-share-count =" false ">
Robert Reich tem três perguntas muito boas sobre a nova universidade on-line Udacity de Sebastian Thrun, que escrevi sobre a semana passada. Eu falei com Thrun ontem, então aproveitei a oportunidade para esclarecê-los.
1. Por que Thrun precisa sair de Stanford? Por que não prosseguir o projeto sob o guarda-chuva de Stanford, com sua reputação enorme e global? De fato, não havia feito uma demonstração do conceito com sua aula de Inteligência Artificial em Stanford? Por que não apenas continuar com isso em forma expandida em Stanford?
Como Thrun diz em sua página inicial, ele desistiu de Stanford em 1 de abril de 2018 e # 8212; antes de oferecer a classe livre em inteligência artificial # 8212; & # 8220; principalmente para continuar meu emprego com o Google & # 8221 ;. Thrun é um empregado muito bem-sucedido e bem-sucedido do Google, e ele de alguma forma estava combinando isso, antes de 2018, com um professor totalmente titular em Stanford. Isso foi feito através de algo chamado & # 8220; leave time & # 8221; & # 8212; Mas deixar o tempo é finito, e eventualmente Thrun ficou sem isso. Quando isso aconteceu, Thrun me disse, # 8220; eu disse que não estou pronto para deixar o Google ainda # 8221 ;. Então ele desistiu de seu mandato em Stanford, e se tornou um professor de pesquisa não remunerado de Stanford.
Isso ajuda a responder a outra das perguntas do Reich. & # 8220; Se Thrun desenvolveu a classe [AI] como membro do corpo docente em Stanford, & # 8221; ele pergunta, & # 8220; então Stanford não tem alguma reivindicação sobre pelo menos o conteúdo do curso? # 8221; A resposta, ao que parece, é que Thrun desenvolveu a aula depois que ele desistiu de sua posição em Stanford. E, como resultado, o conteúdo do curso não pertence a Stanford, mas sim à empresa KnowLabs, Thrun & # 8217; s.
O que é mais, a versão on-line do curso, que não foi hospedada no site da Stanford, foi muito cuidadoso com a marca Stanford. Sim, o curso on-line não fez nenhum segredo sobre o fato de que era basicamente exatamente o mesmo curso que Thrun estava ensinando a um grupo de graduados de Stanford. Mas a certificação final não mencionou Stanford.
Deixando Stanford, Thrun me disse, # 8220 era a única maneira de puxar isso. A declaração de que podemos deixar os alunos fazerem exames e se compararem com estudantes de Stanford, é algo que eu não acho que a universidade tenha aprovado. # 8221;
Quando NPR entrevistou Thrun para uma história sobre Udacity, eles também receberam uma declaração muito entusiasmada de Stanford:
O colega Andrew Ng da Thrun & # 8217; ensinou uma aula de aprendizado de máquinas gratuita e on-line que atraiu mais de 100 mil alunos. Quando pergunto a Ng como a administração de Stanford respondeu a sua proposição, ele permaneceu em silêncio por um segundo. & # 8220; Oh boy, & # 8221; ele diz: "Eu acho que havia um forte senso de que estávamos de repente em um mundo novo e corajoso." # 8221;
Ng diz que houve longas conversas sobre se deve ou não dar aos alunos on-line um certificado com o nome da universidade. Mas Stanford recusou-se e, em última instância, a escola resolveu dar aos alunos uma carta de realização dos professores que não mencionou o nome da universidade.
& # 8220; ainda estamos tendo conversas sobre isso, & # 8221; diz James Plummer, diretor da Stanford & # 8217; s School of Engineering. & # 8220; acho que será realmente um longo período de tempo - talvez nunca - quando os graus reais de Stanford seriam dadas para o trabalho totalmente online por qualquer pessoa que deseje se inscrever nos cursos. & # 8221;
Stanford, então, conseguiu sair desta história cheirando razoavelmente bem: ajudou a dar a Thrun a plataforma de lançamento da Udacity, e não se queixou visivelmente sobre o material do seu curso aparecendo online de graça. Mas ele realmente não o ajudou de maneira ativa, e provavelmente, se Thrun tivesse estado afiliado com Stanford indo para frente, teria acabado impedindo o que Thrun queria fazer.
Thrun não está chateado com isso: ele entende por que seu sonho não é realmente compatível com o que Stanford faz. & # 8220; Se você classificar pessoas externas sem verificar a identidade, & # 8221; ele diz, & # 8220; você abre a porta da tampa para a fraude. A posição de Stanford estava muito bem justificada. Eles não eram anal, estavam preocupados. Mas eu senti que devíamos apenas ensinar estudantes on-line de graça, e que o compromisso que recebemos com isso excede a incerteza que vem desses novos certificados. & # 8221;
Na verdade, a taxa de inscrição para os novos cursos da Udacity & # 8217; parece ser exatamente a mesma taxa de inscrição para a classe AI que foi marcada com Stanford: a falta de uma marca de Stanford não é # 8217; t Parece ter dificultado muito a Udacity. E da mesma forma, o incrível sucesso da Khan Academy ocorreu sem qualquer co-branding com uma venerável instituição de legado.
Não há dúvida de que Stanford é extremamente bom em fazer o que Stanford faz & # 8212; que é contratar grandes professores de pesquisa, selecionar uma pequena minoria dos alunos que querem um diploma de Stanford e, em seguida, reunir os dois grupos de forma produtiva, ao mesmo tempo em que constrói uma reputação de classe mundial e atua como o coração batendo do Vale do Silício , bombeando conhecimento para os bairros vizinhos e criando o que é indiscutivelmente a região mais inovadora do mundo.
Entretanto, tanto Stanford como Silicon Valley são mais amplamente instituições de elite, que abriram o ultra-produtivo 1%. As ambições de Thrun são mais demotivas e, nesse sentido, cortadas contra o que Stanford representa.
Udacity é muito uma instituição de ensino e não uma instituição de pesquisa. & # 8220; Em Stanford, a prioridade é sua carreira de pesquisa, & # 8221; diz Thrun. & # 8220; Isso é contrário ao ensino de 100.000 alunos, que geram 100.000 e-mails. & # 8221; Olhou de uma visão de 30 mil pés, Stanford é a instituição que está sendo interrompida aqui, e a instituição não está perturbando.
E isso também ajuda a explicar por que Thrun não está fazendo Udacity sob os auspícios do Google. Ele diz que a Udacity se encaixa bastante facilmente na missão do Google de disponibilizar as informações do mundo gratuitamente, mas que, ao mesmo tempo, o Google não precisa de um cachorro nesta luta particular. & # 8220; Ter uma ardósia limpa é uma maneira melhor de começar, & # 8221; diz Thrun. & # 8220; A última coisa que eu quero é que as pessoas perguntem se o Google está interrompendo a educação. É melhor perguntar se Sebastian está tentando interromper a educação. & # 8221;
(Dito isto, o amigo e chefe do Thrun & Sergei Brin ocupa um lugar proeminente no vídeo de lançamento do primeiro curso da Udacity & # 8217; é claro que a Udacity tem o forte apoio de Brin & # 8217; e claro O Google também é um grande defensor da Academia Khan, tendo obtido cerca de US $ 2 milhões.)
Então, é muito fácil ver como Thrun, se ele queria criar uma organização que poderia crescer incrivelmente rápido em todo o mundo, pode querer fazê-lo sem ter que obter o sinal de Stanford em tudo primeiro. Mas isso não responde a segunda pergunta de Reich:
2. Por que Udacity é uma empresa com fins lucrativos? Thrun disse que os cursos de Udacity seriam gratuitos para estudantes e Thrun citou a academia de Salman Khan e Khan como inspiração e modelo para o que ele está fazendo. Mas a Academia Khan é sem fins lucrativos. A Universidade de Stanford é uma organização sem fins lucrativos. Thrun diz que quer democratizar a educação superior, oferecendo conhecimento ao mundo gratuitamente. Como essa missão se encaixa com sua universidade online com fins lucrativos?
Eu perguntei a Thrun sobre isso também, e ele respondeu dizendo que o "lucro" não é forçado a lucrar. Eu precisava reunir as pessoas muito rápido, e é muito mais fácil fazer isso sob as formas de uma empresa do Vale do Silício. # 8221;
Certamente, a velocidade com que a Udacity foi lançada, com uma equipe de alta qualidade, é um testemunho da velocidade natural com a qual as coisas são feitas no Vale do Silício. Conduzir o lançamento foi o financiamento de sementes da Charles River Ventures, enquanto a página de empregos do site orgulhosamente oferece salários competitivos, benefícios e opções de ações da série A # 8221; para alguém pensando em trabalhar na Udacity.
Este é um modelo interessante, e não é necessariamente o que eu escolheria. Salman Khan, por exemplo, é bastante explícito sobre por que é bom que ele é sem fins lucrativos e a maneira pela qual os sonhos de capitalistas de risco que o abordaram estão em conflito com sua visão fundamental. O que é mais, Khan acabou recebendo US $ 5 milhões do capitalista de risco irlandês Sean O & # 8217; Sullivan & # 8212; apenas como uma subvenção filantrópica, e não como um investimento de capital. E certamente Thrun não tem vontade de se juntar às filiais das faculdades com fins lucrativos da América, que fazem seu dinheiro com taxas de propinas.
Mas ainda assim, a educação on-line é jovem o suficiente para que valha a pena tentar muitos modelos diferentes para ver quais funcionam. Udacity parece ser construído sobre o modelo de VC padrão de obter escala primeiro, se preocupe em monetizá-lo mais tarde. E se Udacity acabar com milhões de estudantes, eu deveria imaginar que existem muitas empresas que pagariam Udacidade para poder alcançar esses alunos. Simplesmente cobrando empresas de tecnologia para colocar oportunidades de emprego na frente de estudantes com graus e qualificações determinados, provavelmente geraria taxas bastante pesadas. Desde que a educação em si permaneça livre, não penso que ser lucrativo é por si só uma coisa ruim.
& # 8220; Devemos tentar muitas coisas diferentes, & # 8221; diz Thrun. Creio na revolução educacional que Salman começou. Eu acredito que a educação pode mudar o mundo. Então, por que não tente uma centena dessas coisas. & # 8221;
Isso parece razoável para mim. Uma grande parte do sucesso dos dois cursos da Khan & Thrun & # 8217; s é a forma como eles foram apresentados e executados, em vez de qualquer modelo comercial por trás deles. Khan, em particular, é um educador natural extremamente talentoso. E o que ambos aspiram a fazer é construir o que Thrun chama & # 8220; magic & # 8221; na forma como eles ensinam. Thrun quer adicionar outro elemento, também, # 8212; comunidade. Seus cursos têm uma data de início e uma data final e prazos, com milhares de alunos todos tendo a mesma classe ao mesmo tempo; o que os torna inerentemente sociais de uma forma que os vídeos do YouTube da Khan são # 8217; t.
Finalmente, pergunta a Reich,
3. O que fazer do prazer aparente de Thrun pelo fato de que 170 dos 200 estudantes de Stanford que se matricularam na versão real, nao on-line, da classe de AI de Stanford, pararam de chegar à aula, preferindo o Thrun on-line à carne - e-sangue Thrun?
Esse prazer, eu tenho certeza, é genuíno. Eu acho que Khan e Thrun estão na vanguarda de uma nova e mais pessoal maneira de ensinar # 8212; Pense neles como tendo habilidades de tela-ator em um mundo que históricamente recompensou habilidades de ator de palco. Quando você ensina online, você está ensinando de forma conversacional, em um espaço individual. E verifica-se que muitos estudantes & # 8212; possivelmente a maioria dos estudantes & # 8212; preferem ser ensinados dessa maneira, em oposição ao modelo antiquado onde um conferencista se levanta em frente a uma sala de aula lotada e declara para muitas pessoas ao mesmo tempo. A maioria dos estudantes é naturalmente tímida; eles não gostam de falar na aula e dizendo que eles não entendem algo. Online, eles podem apenas rebobinar e reproduzir, ou pausar e procurá-lo na Wikipédia.
E então, é claro, o fato de que os incentivos para o professor são muito maiores on-line, se a maioria dos professores for conduzida pela oportunidade de transmitir conhecimento aos alunos. & # 8220; Esta é a melhor coisa que posso fazer na minha vida, & # 8221; diz Thrun. & # 8220; eu habilitei mais estudantes em 2 meses do que em toda a minha vida antes. Naquela escala, eu estava fora das paradas no último trimestre. & # 8221; E, claro, Thrun está mal nos gráficos, se você o compara com o número de estudantes que Khan alcançou.
O que Khan e Thrun e outros estão criando é um novo paradigma educacional, que promete não apenas uma escalabilidade muito maior do que qualquer coisa que tivemos até agora, mas também uma educação de qualidade superior. Essa é a verdadeira lição dos estudantes de Stanford da Thrun em sua classe on-line: isso significa que o modelo on-line realmente pode ter seu bolo (alcançar milhões de pessoas) enquanto está comendo também (seja melhor para estudantes do que os cursos oferecido em instituições de elite).
O truque é a intimidade, de uma forma que aproveita plenamente a natureza inclinada das telas de computador. Eu estou na Inglaterra agora, onde a Universidade Aberta existe há mais de 40 anos. O OU sempre atingiu estudantes através dos médios lean-back de TV e rádio, o que, por sua vez, encorajou seus palestrantes a se comportar como se estivessem tentando alcançar uma grande audiência. Quando você vê Salman Khan ou Sebastian Thrun desenhando fotos na tela do computador na sua frente, enquanto as escuta falar com você através de fones de ouvido que você está usando, a experiência é muito diferente & # 8212; É uma experiência muito mais imersiva e íntima. Sopre o vídeo do YouTube até a tela cheia, e pula o buraco do coelho. Você pode simplesmente aprender alguma coisa.

Infosys Contrata com Udacity para oferecer treinamento e Nanodegrees.
No mês passado, a Infosys, que é conhecida como líder global em consultoria, tecnologia e terceirização, anunciou que estava se associando com a empresa de educação on-line, a Udacity, por um segundo ano consecutivo para expandir ainda mais o programa FastTrack Infosys-Udacity. O projeto, que visa ampliar os empregados & # 8217; habilidades tecnológicas, também oferecerão os populares Nanodegrees da Udacity & # 8217; Para a Infosys, o programa aponta para o crescimento contínuo e uma mudança na ênfase do pessoal para o treinamento. Por Udacidade, a parceria sugere um crescente interesse pela expansão global.
Um líder em pessoal global cresce com o eLearning.
Desde 1981, a Infosys, empresa de serviços de consultoria e tecnologia de informação global da New York Stock Exchange, vem crescendo. Hoje, tem mais de 198 mil funcionários em todo o mundo e está avaliado em aproximadamente US $ 34,50 bilhões. As horas extras, a Infosys teve muitos marcos. A empresa foi pioneira no modelo de entrega global e foi a primeira empresa de TI da Índia a ser listada no NASDAQ. O programa de opções de ações dos empregados da empresa também teve um enorme impacto nos funcionários da empresa (o programa é creditado pela produção de alguns dos primeiros milionários trabalhistas da Índia). Agora, a Infosys parece estar preparada para continuar crescendo, pois gira cada vez mais sua atenção para questões de treinamento e desenvolvimento.
O programa FastTrack Infosys-Udacity.
O programa FastTrack Infosys-Udacity tem vários objetivos principais. Primeiro, o programa pretende proporcionar aos alunos a oportunidade de completar um programa Nanodegree on-line antes de ingressar no programa de treinamento da Infosys em Mysore. Nanodegrees, que são uma das ofertas mais populares da Udacity & # 8217; ajudar as pessoas a obter # 8220; trabalho pronto e # 8221; dominando habilidades específicas na demanda (por exemplo, na ciência dos dados e no aprendizado de máquinas). Em segundo lugar, como parte do programa FastTrack Infosys-Udacity, os estagiários da Infosys terão acesso a cursos ministrados por especialistas líderes e mentores individuais e feedback detalhado para maximizar seu crescimento. Em terceiro lugar, a parceria, embora de benefício óbvio para os indivíduos, também atende ao mandato mais amplo da Infosys: o programa FastTrack Infosys-Udacity preparará um grupo de talentos existente para trabalhar em projetos mais ambiciosos e aumentar a capacidade de pessoal da Infosys. projetos emergentes (por exemplo, em mineração de dados e aprendizagem de máquinas) em todo o mundo.
O programa Infosys-Udacity reflete uma tendência.
O Dr. Navin Budhiraja, que é o Diretor de Tecnologia da Infosys Ltd, explica que o Programa FastTrack Infosys-Udacity faz parte da tentativa contínua da Infosys de apoiar a aprendizagem ao longo da vida: & # 8220; Na Infosys, nosso foco tem evoluiu de aprender habilidades tecnológicas específicas para aprender a aprender. Estamos constantemente investindo para trazer uma cultura de aprendizagem ao longo da vida cedo, especialmente para os nossos jovens engenheiros. Através da nossa parceria com a Udacity, agora podemos complementar essa aprendizagem e construir uma base sólida com treinamento de habilidades especializadas, e aguardo com expectativa a ampliação dessa parceria. # 8221;
Vish Makhijani, CEO da Udacity.
Vish Makhijani, Diretor Executivo da Udacity, também vê a parceria como um meio vital para melhorar os trabalhadores no grande grupo de empregos da Índia: a Udacity tem estado na vanguarda do fornecimento de habilidades tecnológicas mais recentes e relevantes para preparar a força de trabalho global para os empregos de hoje e de amanhã. Há uma grande demanda dentro da indústria de TI na Índia para atuar em trabalhadores e liderar o mundo no desenvolvimento de software, e estamos entusiasmados em levar nossa parceria com a Infosys em nosso segundo ano para treinar ainda mais seu grupo de talentos. # 8221;
Em muitos aspectos, no entanto, o programa FastTrack Infosys-Udacity faz parte de uma tendência emergente maior. Conforme relatado em um artigo anterior do eLearning Inside News na compra do LinkedIn $ 823 bilhões da plataforma de treinamento, Lynda, as empresas de treinamento e treinamento continuam a mesclar. A vantagem de trazer oportunidades de eLearning robustas e até mesmo Nanodegrees, como as oferecidas pela Udacity, para empresas de pessoal e plataformas de contratação é óbvia. As empresas de pessoal ganham valor ao serem capazes de responder melhor às mudanças contínuas de necessidades de pessoal e de ter mais controle de qualidade sobre os empregados que colocam em empregos. Claro, as empresas de eLearning também têm muito a ganhar com essas parcerias estratégicas. Mais notavelmente, quando os líderes da eLearning se juntam com empresas de pessoal, eles podem acessar um grande e motivado grupo de alunos. Dado o sucesso tanto da compra do LinkedIn quanto do programa FastTrack Infosys-Udacity, mais recente, parece provável que avançemos, continuaremos a ver mais fusões e parcerias entre as empresas de pessoal e eLearning.
Notícias relacionadas.
Um MOOC para Drone Pilots.
NY EdTech Week & # 8217; s Higher Education Panel.
As atitudes para a aprendizagem móvel dividem as linhas socioeconômicas.
7 Comentários.
Apenas para informá-lo, isso não está disponível para os funcionários existentes da Infosys. E apesar de falar sobre a aprendizagem ao longo da vida, em alguns países, a Infosys não oferece suporte para aprender e tem acesso limitado aos recursos próprios das empresas.
Postado como anon porque este país castiga qualquer um que sugere que não é nada além de maravilhoso.
Obrigado pela sua resposta. Toque base comigo no cait. etherington@gmail se desejar compartilhar informações adicionais, uma vez que estamos sempre felizes em investigar nossas histórias ainda mais e apresentar diferentes perspectivas.
[& # 8230;] Leia a história completa por eLearningInside News [& # 8230;]
Eu segundo comentários do annon. Líder mundial em consultoria ... AHEM & # 8230; Desde quando? Quem reconhece tal & # 8230; Infy tem a habilidade de enviar comunicados de imprensa para melhorar sua imagem. mas a realidade é muito diferente. Muito poucas oportunidades para melhorar o que a empresa espera que os funcionários façam sozinhos e sejam relevantes, o Axe está aguardando. Os fundos de treinamento não são alocados para os gerentes, então, como o funcionário pode se qualificar. Por isso, o motivo de Infy ser um seguidor em muitas tecnologias. Que pena. Eles são vítimas de seus próprios projetos.
[E # 8230;] de seu potencial, mesmo empresas como Infosys, Wipro, Honeywell e JustDial patrocinaram programas de Udacity para seus funcionários. Paytm, [& # 8230;]
[E # 8230;] de seu potencial, mesmo empresas como Infosys, Wipro, Honeywell e JustDial patrocinaram programas de Udacity para seus funcionários. Paytm, [& # 8230;]
[E # 8230;] do seu potencial, mesmo empresas como Infosys, Wipro, Honeywell e JustDial patrocinaram programas de Udacity para [& # 8230;]
Deixe uma resposta.
Últimas notícias.
Um MOOC para Drone Pilots.
NY EdTech Week & # 8217; s Higher Education Panel.
As atitudes para a aprendizagem móvel dividem as linhas socioeconômicas.
mais popular.
Alexa da Amazon: seu próximo professor.
Por que o eLearning crescerá em Ed mais elevado em 2018.
Binge Learning: o que a Educação Online pode aprender com a Netflix.
ElearningInside News traz notícias revisadas, bem originadas e investigadas para a comunidade de e-Learning. Nós aspiramos a produzir notícias, perfis e soluções relevantes, oportunas e perspicazes para ajudar a educar nossos leitores.

Onde investidores privados acessam Startups provados TM.
Acionista?
Onde investidores privados acessam Startups provados TM.
Acionista?
Adicionado ao Pipeline este mês *
Invista agora em empresas da Great Tech.
Nas Palavras dos nossos clientes.
^ Experiências específicas do cliente não são representativas de todas as experiências dos clientes e não são garantia de retornos futuros ou sucesso.
Na imprensa.
Acionistas.
Diversifique seu risco Obtenha dinheiro para eventos de vida (dívida estudantil, hipoteca)
Investir em empresas comprovadas e pré-IPO Diversificar sua carteira de investimentos.
Assuma o controle da liquidez dos acionistas Não há mudança recorrente na Tabela de Capitais Nenhuma transferência de direitos de voto ou de informação.
* Inclui Oportunidades de Investimento Negociável (conforme definido posteriormente) que foram obtidos através da plataforma EquityZen nos últimos 30 dias. As Oportunidades de Investimento Negociáveis são definidas como oportunidades de investimento que: a) acreditamos que receberiam interesse do investidor, b) se enquadram no mandato da plataforma EquityZen (que é principalmente focada em empresas de tecnologia privada em fase tardia) e c) não tem conhecimento restrições que impediriam a ocorrência de uma transação. O tamanho máximo de uma Oportunidade de Investimento Negociável geralmente é de US $ 500.000. Nem todas as oportunidades adicionadas ao pipeline estão atualmente disponíveis para investimento.
Interessado em saber mais?
Para saber mais sobre se você é elegível, tamanho de investimento típico, avaliação da empresa e preço da ação, solicite acesso aqui.
Nossa missão é melhorar a forma como os empregados de inicialização são pagos desbloqueando o valor de sua compensação de capital de uma maneira que beneficia todos os principais atores: o acionista, a empresa e o investidor.
Os títulos de capital são oferecidos através da EquityZen Securities LLC. Verifique o plano de fundo desta empresa no BrokerCheck da FINRA.
10 West 18th Street,
New York, NY 10011.
&cópia de; 2017 EquityZen Inc. Todos os direitos reservados.
Nós estamos aqui para ajudar! Confira nossa FAQ, Investor Step by Step e Shareholder Step by Step para obter respostas a perguntas comuns. Ainda tem uma pergunta ou precisa de suporte? Envie-nos uma mensagem rápida e nós voltaremos para você.
Obrigado pela sua mensagem - entraremos em contato em breve.

opções de estoque de Udacity
Pegue os pedidos 1.
Participe do GitHub hoje.
O GitHub é o lar de mais de 20 milhões de desenvolvedores que trabalham juntos para hospedar e rever o código, gerenciar projetos e criar software juntos.
Clone com HTTPS.
Use o Git ou o check-out com o SVN usando o URL da web.
#### Projeto Final para Curso de Aprendizagem de Udacidade.
## Enron POI Detector Project Assignment --- Visão geral do projeto ---
Em 2000, a Enron foi uma das maiores empresas nos Estados Unidos. Em 2002, desabou em falência devido à fraude corporativa generalizada. Na investigação federal resultante, houve uma quantidade significativa de informações tipicamente confidenciais inseridas no registro público, incluindo dezenas de milhares de e-mails e dados financeiros detalhados para os principais executivos. Neste projeto, você vai jogar detetive e colocar suas novas habilidades para usar, construindo um identificador de identificação de pessoas com base em dados financeiros e de e-mail divulgados como resultado do escândalo da Enron. Para ajudá-lo no seu trabalho de detetive, combinamos esses dados com uma lista gerada mão de pessoas de interesse no caso de fraude, o que significa que os indivíduos que foram indiciados, chegaram a um acordo ou um acordo de súplica com o governo ou testemunharam em troca de imunidade judicial.
Você deve ter python e sklearn em execução no seu computador, bem como o código inicial (ambos os scripts python e o conjunto de dados Enron) que você baixou como parte do primeiro mini-projeto. O código inicial pode ser encontrado no diretório final_project da base de códigos que você baixou para uso com os mini-projetos. Alguns arquivos relevantes:
poi_id. py: código inicial para o identificador POI, você escreverá sua análise aqui.
final_project_dataset. pkl: o conjunto de dados para o projeto, mais detalhes abaixo.
tester. py: quando você faz sua análise para avaliação pelo seu treinador da Udacity, você enviará o algoritmo, o conjunto de dados e a lista de recursos que você usa (estes são criados automaticamente em poi_id. py). Esse treinador usará esse código para testar seu resultado, para garantir que vejamos um desempenho semelhante ao que você denuncia. Você não precisa fazer nada com este código, mas nós o fornecemos para transparência e para sua referência.
email_by_address: este diretório contém muitos arquivos de texto, cada um dos quais contém todas as mensagens para ou de um endereço de e-mail específico. É para sua referência, se você deseja criar recursos mais avançados com base nos detalhes do conjunto de dados de e-mails.
Vamos fornecer-lhe o código inicial, que lê nos dados, leva os seus recursos de escolha e, em seguida, coloca-os em uma matriz numpy, que é o formulário de entrada que a maioria das funções sklearn assumem. Seu trabalho é criar os recursos, escolher e ajustar um algoritmo, testar e avaliar seu identificador. Vários dos mini-projetos foram projetados com este projeto final em mente, então esteja atento a maneiras de usar o trabalho que você já fez. Sua submissão terá 2 partes. Primeiro e, o mais importante, você deve documentar suas etapas finais do projeto em uma série de perguntas focadas no site da Udacity. Suas respostas devem ser cerca de 1 parágrafo para cada pergunta; Juntos, eles serão o jeito que você denuncia a outra pessoa (mais notavelmente o seu treinador da Udacity) o que você tentou e o que acabou por usar como estratégia de análise final. Recomendamos que você mantenha notas enquanto trabalha no projeto; seu processo de pensamento é, em muitos aspectos, mais importante do que o seu projeto final e tentaremos analisar seu processo de pensamento nessas questões. Em segundo lugar, você criará três arquivos de pickle (my_dataset. pkl, my_classifier. pkl, my_feature_list. pkl) e transformá-los em seu treinador da Udacity quando você enviar seu write-up; Seu treinador irá testá-los usando o script tester. py. Este passo é apenas para verificar se você criou um código de aprendizado de máquina utilizável e para verificar o desempenho e os parâmetros do seu algoritmo. Estes arquivos de pickle já estão configurados para serem feitos no final de poi_id. py, você não precisa adicionar nenhum código para criá-los. Como você provavelmente já está ciente, como pré-processamento para este projeto, combinamos os dados eletrônicos e financeiros da Enron em um dicionário, onde cada par chave-valor no dicionário corresponde a uma pessoa. A chave do dicionário é o nome da pessoa e o valor é outro dicionário, que contém os nomes de todos os recursos e seus valores para essa pessoa. Os recursos disponíveis para você são os seguintes:
['salário', 'to_messages', 'pagamento de diferimento', 'total_payments', 'loan_advances', 'bonus', 'email_address', 'restricted_stock_deferred', 'reportado_income', 'total_stock_value', 'despesas', 'from_poi_to_this_person' ',' exercido_stock_options ',' from_messages ',' other ',' from_this_person_to_poi ',' poi ',' long_term_incentive ',' shared_receipt_with_poi ',' restricted_stock ',' director_fees ']
Estes se dividem em três tipos principais de recursos, nomeadamente recursos financeiros, recursos de e-mail e rótulos de POI.
['salário', 'pagamento de diferimento', 'total_pago', 'empréstimo_avança', 'bônus', 'restrito_stock_deferred', 'adiantamento diferido', 'total_stock_value', 'despesas', 'exercido_stock_options', 'outro', 'long_term_incentive', ' restricted_stock ',' director_fees '] (todas as unidades estão em dólares americanos)
['to_messages', 'email_address', 'from_poi_to_this_person', 'from_messages', 'from_this_person_to_poi', 'poi', 'shared_receipt_with_poi'] (as unidades são geralmente o número de mensagens de e-mails, exceção notável é 'endereço de e-mail', que é uma string de texto )
['Poi'] (booleano, representado como inteiro)
Você é encorajado a fazer, transformar ou redimensionar novos recursos dos recursos iniciais. Se você fizer isso, você deve armazenar o novo recurso no my_dataset e, se você usar o novo recurso no algoritmo final, você também deve adicionar o nome do recurso à my_feature_list, para que seu treinador possa acessá-lo durante o teste. Para um exemplo concreto de um novo recurso que você poderia adicionar ao conjunto de dados, consulte a lição sobre Seleção de Função.
--- Informação de fundo sobre as fontes de dados e as convenções ---
Os dados financeiros provêm da fonte enron61702insiderpay. pdf, que está incluída para sua referência no diretório de ferramentas. Os dados de e-mail provêm do corpus de e-mail da Enron, que introduzimos na Lição 5 em conjuntos de dados e perguntas; Você deveria ter baixado e descompactado este conjunto de dados como parte do processo de configuração do código. Os recursos de e-mail em final_project_dataset. pkl são agregados do conjunto de dados de e-mail e eles gravam o número de mensagens para ou de uma determinada pessoa / endereço de e-mail, bem como o número de mensagens para ou de um endereço de e-mail POI conhecido e o número de mensagens que compartilharam o recibo com um POI. Para ajudá-lo a navegar as mensagens por conta própria, se isso é algo que você quer fazer, fornecemos o diretório final_projeto / emails_by_address, que contém listas de todas as mensagens para e de cada endereço de e-mail no corpus - por exemplo, Se você quiser ler todos os e-mails de Sara Shackleton, pode encontrá-los listados em "from_sara. shackleton@enron. txt"
Nem todos os recursos têm valores para todas as pessoas no conjunto de dados. Quando o valor para um recurso particular é desconhecido, "NaN" aparece para essa pessoa / recurso. Quando os dados são transformados em uma matriz numpy, "NaN" é convertido em 0 por padrão.
&cópia de; 2017 GitHub, Inc. Termos Privacidade Segurança Status Ajuda.
Você não pode executar essa ação neste momento.
Você fez login com outra guia ou janela. Recarregue para atualizar sua sessão. Você se separou em outra guia ou janela. Recarregue para atualizar sua sessão.

opções de estoque de Udacity
Puxe pedidos 0.
Participe do GitHub hoje.
O GitHub é o lar de mais de 20 milhões de desenvolvedores que trabalham juntos para hospedar e rever o código, gerenciar projetos e criar software juntos.
Clone com HTTPS.
Use o Git ou o check-out com o SVN usando o URL da web.
O objetivo deste projeto é classificar a pessoa de interesse (POIs) usando os dados financeiros e de frequência de e-mail da Enron fornecidos pela Udacity. O conjunto de dados inclui 146 registros (com 20 recursos originais), 18 registros dos quais foram rotulados como POIs. Ao examinar o conjunto de dados e fazer uso do que parecem ser os recursos mais relevantes, torna-se possível prever POIs com uma taxa de precisão melhor do que adivinhar.
[N. B. Salvo especificação em contrário, o GaussianNB foi usado como classificador de controle ao discutir as métricas de desempenho.]
Usando todos os recursos iniciais (exceto o endereço de e-mail (que foi removido como recurso devido à sua óbvia habilidade para identificar POIs), os escores de precisão e recall (definidos abaixo) foram 0.14720 e 0.83000, respectivamente.
Os outliers estavam presentes nos dados. Ao analisar esses valores atípicos, ficou claro que pelo menos um dos registros não representava um indivíduo, mas os totais calculados de cada coluna. Este registro TOTAL foi removido do conjunto de dados, bem como gravar com a chave A AGÊNCIA DE VIAGEM NO PARQUE. Essa modificação fez com que os escores de precisão e recuperação aumentassem (precisão: 0.14746, recall: 0.83450).
Todos os valores faltantes (codificados como 'NaN's) foram imputados com suas respectivas medias colunares. Essa modificação fez com que a precisão e os recorde de recuperação mudassem (diminuição de precisão: 0.14719, recall aumentado: 0.84200).
Eu criei uma única característica nova, na esperança de capturar a relação entre bônus e salário (neste caso, sua relação), que eu esperava ter uma relação com a identificação de POI. Essa modificação fez com que a pontuação de precisão aumentasse (precisão: 0.14812), enquanto a pontuação de recuperação permaneceu inalterada.
Eu removi os recursos aparentemente inúteis ao analisar as pontuações do SelectKBest para valores de k [1,20].
O valor de melhor pontuação de k foi de 5. Quando k = 5, a pontuação de precisão aumentou para 0.50161 e, enquanto a pontuação de recall diminuiu tecnicamente para 0.39050, esse par de pontuação representa um saldo muito melhor do que os escores testemunhados acima usando todos os características. Como resultado, os recursos mantidos para o restante do estudo foram: exercished_stock_options, total_stock_value, bonus, salário e reportados.
Neste ponto, adicionei um Pipeline, StratifiedShuffleSplit e GridSearchCV. Essa modificação não fez com que os escores de precisão ou recall fossem alterados.
Então, eu adicionei o StandardScaler ao Pipeline. Essa modificação não fez com que os escores de precisão ou recall fossem alterados.
Então, adicionei RandomizedPCA ao Pipeline. Essa modificação fez com que o escore de precisão e a pontuação de recuperação diminuíssem (precisão: 0.47740, recall: 0.34850).
Finalmente, forneci opções de parâmetros para GridSearchCV para sintonizar para RandomizedPCA: iterated_power = [1, 2, 3], n_components = [2, 4, 6, 8, 10], whiten = [Verdadeiro, Falso]. Na primeira tentativa, GridSearchCV selecionou os seguintes valores: iterated_power = 1, n_components = 2, whiten = True. Essas configurações fizeram com que a pontuação de precisão aumentasse (0.58291) e a pontuação de recuperação para diminuir (0.34800).
Conforme mencionado acima, GaussianNB foi usado como classificador de controle.
DecisionTreeClassifier foi implementado. Com suas configurações padrão, deu menor precisão e pontuação de recuperação: 0.22458 e 0.24300, respectivamente.
As seguintes opções de parâmetro DecisionTreeClassifier foram fornecidas para GridSearchCV para sintonizar: class_weight = ['auto', None], criterion = ['gini', 'entropy'], max_features = ['auto', 'sqrt', 'log2', None ]. Na primeira tentativa, GridSearchCV selecionou os seguintes valores: class_weight = 'auto', criterion = 'entropy', max_features = None. Essas configurações fizeram com que as pontuações de precisão e recuperação aumentassem (precisão: 0.30337, recall: 0.30200).
O SVC foi implementado. Com suas configurações padrão, apresentou menor pontuação de precisão e recall: 0.27273 e 0.04350, respectivamente.
As seguintes opções de parâmetros SVC foram fornecidas para GridSearchCV para sintonizar: C = [2 x para x em np. arange (-15, 15 + 1, 3)], gama = [2 x para x em np. arange (-15, 15 + 1, 3)]. On the first attempt, GridSearchCV selected the following values: C=512, gamma=0.001953125. These settings caused both the precision and recall scores to increase: 0.44633 and 0.11850, respectively.
Out of the classifiers (and preprocessing techniques) used, GaussianNB performed the best (without PCA: precision: 0.50161, recall: 0.39050), so it was selected as the final algorithm.
Most algorithms have parameters that should be tuned in order to modify their training performance, which is in part dependent on the nature of the data set under consideration.
As discussed above, for both preprocessing and classification, GridSearchCV was used to tune various parameters (where applicable) for each implemented preprocessor and classifier. For suggestions related to parameter tuning for SVC(), I consulted csie. ntu. edu. tw/
Breaking the data into training and testing sets is a component of a statistical assessment method called cross-validation , which is an effort to estimate how well a model will perform/generalize when it encounters new data. To this end in the current context, data sets used for training machine-learning models are broken up into separate training and testing sets. After models are trained with the training data alone, models are then evaluated using only the testing data.
As the current data set under consideration includes, as mentioned above, only 146 records, StratifiedShuffleSplit was used via GridSearchCV during the preprocessor and classifier evaluation phase since it allows for the possiblity of training and testing on all of the data available (i. e., as opposed to training only on a single training set and testing only on a single testing set), averaging the results of each learning session in order to provide a clearer picture of model performance.
Unlike in the current project, if the data separation process described above is not randomized, it is possible to partition the data in such a way that the training and testing sets do not both properly represent the data in a balanced manner (e. g., when experimenting on the Enron data set, it would be possible to create a training set containing only non-POI-related data and a testing set with only POI-related data).
Given the distribution of the final testing set, in particular the small number of POIs, and likely in part due to the binary nature of this specific classification problem, the generic score (i. e., the percentage of correct predictions out of the total number of predictions) for each classifier is easily made higher when POIs are not identified at all (i. e., all predicted labels are 0).
Thus, in this case, using a confusion matrix (and the resulting precision and recall scores) is a better indicator of model/prediction performance. In the current context, both precision and recall scores may be understood as capturing the percentage of correctly-identified POIs; however, precision scores incoporate the number of incorrectly-identified POIs while recall scores incorporate the number of incorrectly-unidentified POIs.
In the case of the final preprocessing and algorithm selections made above, a precision score of 0.50161 may be understood as the percentage of correctly-identified POIs out of all identified POIs. Or, in other words for this particular score, about 50% of all identified POIs were in fact POIs.
Meanwhile, a recall score of 0.39050 may be understood as the percentage of correctly-identified POIs out the total number of known POIs. Or, in other words for this particular score, almost 40% of all the POIs were correctly identified (which, of course, means that about 60% escaped identification).
I hereby confirm that this submission is my work. I have cited above the origins of any parts of the submission that were taken from Websites, books, forums, blog posts, github repositories, etc.
Aside from standard usage of scikit-learn and Python documentation/examples, none of the work above is dependent on any particular source and, thus, the work is my own.
I had hoped to use email-text data along with the financial data, but clearly there is a discrepancy between the individuals represented by the financial data and the email data. Thus, it would be difficult to join the two data sets in a meaningful way due to their lack of overlap.
After this project, I may spend some time with text-vectorization of the email corpus and examine things like word frequencies; however, with such an apparent low number of known POI-emails being available (only 3!?), it's entirely unclear how useful such an endeavor would be for identifying POIs, although there are surely other interesting insights to be gleaned.
&cópia de; 2017 GitHub, Inc. Termos Privacidade Segurança Status Ajuda.
Você não pode executar essa ação neste momento.
Você fez login com outra guia ou janela. Recarregue para atualizar sua sessão. Você se separou em outra guia ou janela. Recarregue para atualizar sua sessão.

No comments:

Post a Comment

Subscribe to: Post Comments (Atom)