Gene Moth_1887 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1887
Symbol
ID	3831232
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	1949715
End bp	1951493
Gene Length	1779 bp
Protein Length	592 aa
Translation table	11
GC content	62%
IMG OID	637829820
Product	NADH dehydrogenase (quinone)
Protein accession	YP_430730
Protein GI	83590721
COG category	[C] Energy production and conversion
COG ID	[COG1894] NADH:ubiquinone oxidoreductase, NADH-binding (51 kD) subunit [COG3411] Ferredoxin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCCGTA TACTAGTCTG TGCCGGGACC GGGTGTGTCG CCTCCCACTC TCGCCAGGTT 
ACCGCCCGGC TGAAGGCCGC CTTGCACGCG CATCACCTGG AAGAAAGGTT CCAGGTGGAT 
AATACAGGCT GCCACGGTTT CTGCGAGCAG GGGCCTCTGG TGATTATCGA GCCGGAGGGC 
ATCCTCTACT GCCGGGTGCG GGAGGAAGAC GTGGAAGCCA TCGTCACCGA ACACCTGGAG 
CAGGGTCGCC TCGTTGAACG CCTCCTCTAC CAGGACCCGG TGACGAAGGA AAAGATAGCC 
GCCTATAACC AGATTAAGTT CTACCGGCAG CAGTCGCGCC ATGTCCTGAA AAACTGCGGT 
CATATCAATC CGGAAAATAT CGACGCCTAC CTGGCCGTCG AAGGCTACCA GGGGTTAAAA 
AAGGCCCTCG CCCTGCCCCG GGAAGAAGTC ATCAATATAA TCAAGGAGTC TGGTTTAAGG 
GGGCGCGGCG GTGCTGGCTT CCCCACCGGG CTGAAGTGGG AGTACACCTT TAAAGCCCCC 
GGCGACCGGA AGTATGTAGT CTGTAACGCC GATGAGGGCG ACCCCGGCGC CTTTATGGAC 
CGCAGCGTCC TGGAAGGCGA CCCCCACGCC GTCCTCGAAG GCATGCTCAT CGCCGCCTAC 
GCCATCGGCG CCCGGGAGGG TTATATCTAC GTCCGGGCCG AGTATCCCCT GGCCGTGCAG 
CGGTTGCGGA TCGCCCTGGC CCAGGCCCGG GAAAGGGGTT TTTGTGGCGA GCGTATCCTG 
GGAACCGATT TTAGCTGCGA ACTCTACATC CGGGAAGGGG CCGGGGCCTT CGTCTGCGGG 
GAAGAAACAG CCCTCCTGGC CTCCATCCAG GGGGAGAGGG GTATGCCCCG GCCACGGCCG 
CCCTTCCCCG CCCGGCAGGG CCTCTGGGGC CAGCCCACCA ACATTAACAA CGTGGAAACC 
TATGCCAACG TGCCGTTGAT CTTACGCCGG GGTGCCGGCT GGTATGCTTC CCTGGGTACG 
GAGAAAAGCA AGGGCACCAA GATATTCGCC CTGACGGGGA AAGTCAAAAA CACCGGCCTG 
GTTGAGGTCC CCATGGGCAT CACCCTGAGG GAGATTATCT TTAACATCGG CGGCGGCATC 
CTGGAGGACC GGGGGTTCAA AGCAGTCCAG ATCGGTGGTC CTTCCGGCGG GTGTTTGCCG 
GCCGAACACC TGGATCTCCC GGTGGACTAC GATTCCCTTA CCGCGGCCGG GGCCATGATG 
GGTTCCGGCG GCCTGGTAGT AATGGACGAT AGTACCTGTA TGGTTGAAGT AGCCCGCTTC 
TTCCTCAATT TTACCCAGGC GGAATCCTGC GGTAAATGTA CACCCTGCCG GGAGGGCATC 
CAGCAGATGC TGGCCATCCT CACCCGCATC ACCAGGGGGC AGGGCCGGGA GGGCGACCTC 
GAGCAACTTG AGCGTCTGGC CCGGGTTATC AAGGGTACGG CCCTTTGCGG CCTGGGGCAG 
ACGGCGCCCA ACCCGGTCCT GTCCACCCTG CGCTATTTCC GCGCCGAATA TGAAGCCCAC 
ATCCGGGACC ACAGGTGCCC GGCGAAAAGC TGCCGGGAAC TCCTTACCTA CCACATCGAC 
CCTGATAAAT GCAACGGTTG CACCCGTTGC CGGCGCCGCT GCCCGGCGGG TGCCATCAGC 
GGCGAGGCCA GGGAACCCCA TACCATTGAC CTGGAACTGT GTGCCCGCTG CGGTACCTGC 
CTGGATCTAT GCCGCCAGAA AGCTATTTAT GTTGAGTAG

Protein sequence

MGRILVCAGT GCVASHSRQV TARLKAALHA HHLEERFQVD NTGCHGFCEQ GPLVIIEPEG 
ILYCRVREED VEAIVTEHLE QGRLVERLLY QDPVTKEKIA AYNQIKFYRQ QSRHVLKNCG 
HINPENIDAY LAVEGYQGLK KALALPREEV INIIKESGLR GRGGAGFPTG LKWEYTFKAP 
GDRKYVVCNA DEGDPGAFMD RSVLEGDPHA VLEGMLIAAY AIGAREGYIY VRAEYPLAVQ 
RLRIALAQAR ERGFCGERIL GTDFSCELYI REGAGAFVCG EETALLASIQ GERGMPRPRP 
PFPARQGLWG QPTNINNVET YANVPLILRR GAGWYASLGT EKSKGTKIFA LTGKVKNTGL 
VEVPMGITLR EIIFNIGGGI LEDRGFKAVQ IGGPSGGCLP AEHLDLPVDY DSLTAAGAMM 
GSGGLVVMDD STCMVEVARF FLNFTQAESC GKCTPCREGI QQMLAILTRI TRGQGREGDL 
EQLERLARVI KGTALCGLGQ TAPNPVLSTL RYFRAEYEAH IRDHRCPAKS CRELLTYHID 
PDKCNGCTRC RRRCPAGAIS GEAREPHTID LELCARCGTC LDLCRQKAIY VE