Gene Moth_0985 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0985
Symbol
ID	3830861
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	1010581
End bp	1012455
Gene Length	1875 bp
Protein Length	624 aa
Translation table	11
GC content	55%
IMG OID	637828914
Product	proton-translocating NADH-quinone oxidoreductase, chain L
Protein accession	YP_429843
Protein GI	83589834
COG category	[C] Energy production and conversion [P] Inorganic ion transport and metabolism
COG ID	[COG1009] NADH:ubiquinone oxidoreductase subunit 5 (chain L)/Multisubunit Na+/H+ antiporter, MnhA subunit
TIGRFAM ID	[TIGR01974] proton-translocating NADH-quinone oxidoreductase, chain L

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAATC ATGCCTGGTT GATACCGGTT TTTCCGGCCC TTGCTTTTCC CATAATTATT 
TTTCTGACCC GTAGAGTGCG CCATTTAAGC GCCCTGGTGG GCATCGCCGC CATCGGCGCC 
AGCTTTGTCA TGGCTGTGGG GGTATTACGG GAAGTCCTGC TTAACGGGAT AACCATGTCC 
CGGCCGGTGG AGTATGCCGC CACCTGGCTG GGGGTCCCCG GTCTTTTGAA GATTGAAGCA 
GGCGTCCTGA TTGATCCCCT GGCAGCGGTA ATGCTCCTGG TAGTCACCCT GGTAGCCCTG 
CTGGTGGAAA TTTATTCAGT GGGTTATATG CACGGCGACC CCGGATTTTC CACTTTTTTC 
GGCTACCTGT CCCTGTTCAG CGCTTCAATG CTGGGACTGG TCCTGGCCAA TAACTACTTT 
ATGATATTTT TCTTCTGGGA GCTTGTTGGA CTTTGTTCCT ATCTTTTAAT AGGTTTCTAT 
TACCACAAGC AGTCGGCGGC CCGGGCCGGC TTGAAGGCCT TTGTTACCAA CAGGGTGGCT 
GACTTCGGTT TCATGCTGGG CTTCTTTTTC CTCTTTGCCA TCTTTGGCAC CTTTAATTTC 
CGGGAACTGG CGGCAGCCAT TCCCAGTTAC AAGAATACCG GCTTCCTGGC CCTGGCGGCG 
GCCCTGGTGT TTATCGGTCC TATCGGCAAG TCGGCCCAGT TCCCTTTACA TGTCTGGTTG 
CCGGACGCCA TGGAGGGTCC TACACCGGTT AGCGCCCTGA TCCATGCTGC GACAATGGTG 
GCAGCCGGTG TCTATTTACT GGCGCGAGCC TTTGTCCTCT TTGCCAGCCT GCCGGGGATT 
ATGCTCTTAG TTGCCTATGT AGGCGGTTTT ACGGCCCTTT TTGCGGCCAC CATAGCCATT 
ACCCAGCGGG ACATCAAGCG CATCCTGGCC TATTCTACCA TCAGCCAGCT GGGATATATG 
GTCATGGCCA TGGGGATCGG CAGTATGACG GCCGGAATGT TCCACCTCAT GACCCATGCT 
TTCTTTAAAG CCCTCCTCTT TCTGGGAGCC GGAAGCGTTA TCCATGCCCT GGAAGAACAG 
GATATTTTCC GCATGGGCGG TTTATATAAG GATATGAAGG TCACGGTAAG TACCTTTGTT 
ATTGCCGCCC TGGCCCTGGC CGGGGTGCCG CCCCTGGCCG GTTTCTGGAG CAAGGACGAG 
ATCCTCGCCG GTGCCTTTGA TCACGGGTTT ACCGGTCTCT ACATCATTGG TACATTGGTA 
GCCTTCTTGA CAGCCTTCTA TATGTTCCGG CTGATCTTCG TGGCCTTTTT CGGCGACCGC 
CGTGCCGGAC TCCATGCTCA CGAATCGCCG TTAACGATGA CGGTGCCCCT AGTCATCCTA 
GCGGTACTTT CAGTGGTTTC CGGTTTTGTA GGGGCGCCCT TTGTGAGCCA CGGGTTCAGC 
AGCTTTGTTT ATTATGGCGA ACCCCATCTG GTAGAACCAA ACTATGGGGT GATGCTGCTT 
TCAACCATCG TAGCCTTGGC TGGCATCGGC CTGGCCTGGG TCCTTTACGG TCGTCCCAGT 
GATGTGCCGG CAAGGCTGGC CGAACGCTAC CACAGCATCT ATAAGCTTCT GGTCAACAAG 
TACTATATTG ATGAGGTCTA CCTGTGGCTT TTCCATCGTG TCGGCCTTGG GCTGGCCGAA 
GCCTTTAACT GGAACGATCG CCATGTTGTT GATGGCGTCT TTGATGGTAT CGGCGATGTA 
ACCCGGTTGT CGGGCCATAG ACTACGCTTG ATCCAGACGG GAAACCTCCA GACCTACGCC 
TTGGTTATCT TTACGGCCGT GGTAATCATT GCCCTCTGGA TGGCAGCACC GGTGTTGGGA 
GGGGTGATCC AGTGA

Protein sequence

MINHAWLIPV FPALAFPIII FLTRRVRHLS ALVGIAAIGA SFVMAVGVLR EVLLNGITMS 
RPVEYAATWL GVPGLLKIEA GVLIDPLAAV MLLVVTLVAL LVEIYSVGYM HGDPGFSTFF 
GYLSLFSASM LGLVLANNYF MIFFFWELVG LCSYLLIGFY YHKQSAARAG LKAFVTNRVA 
DFGFMLGFFF LFAIFGTFNF RELAAAIPSY KNTGFLALAA ALVFIGPIGK SAQFPLHVWL 
PDAMEGPTPV SALIHAATMV AAGVYLLARA FVLFASLPGI MLLVAYVGGF TALFAATIAI 
TQRDIKRILA YSTISQLGYM VMAMGIGSMT AGMFHLMTHA FFKALLFLGA GSVIHALEEQ 
DIFRMGGLYK DMKVTVSTFV IAALALAGVP PLAGFWSKDE ILAGAFDHGF TGLYIIGTLV 
AFLTAFYMFR LIFVAFFGDR RAGLHAHESP LTMTVPLVIL AVLSVVSGFV GAPFVSHGFS 
SFVYYGEPHL VEPNYGVMLL STIVALAGIG LAWVLYGRPS DVPARLAERY HSIYKLLVNK 
YYIDEVYLWL FHRVGLGLAE AFNWNDRHVV DGVFDGIGDV TRLSGHRLRL IQTGNLQTYA 
LVIFTAVVII ALWMAAPVLG GVIQ