Gene Moth_2380 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2380
Symbol
ID	3832019
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2505324
End bp	2506847
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	60%
IMG OID	637830299
Product	ATP synthase F1, alpha subunit
Protein accession	YP_431205
Protein GI	83591196
COG category	[C] Energy production and conversion
COG ID	[COG0056] F0F1-type ATP synthase, alpha subunit
TIGRFAM ID	[TIGR00962] proton translocating ATP synthase, F1 alpha subunit

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0176105
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGCATTC GACCCGACGA GATAACCAGT ATTTTAAAGA ACCAGATTGA ACAATACCAG 
CTGGAAGTAG AAATGGCCGA GGTGGGAACC GTTACCCAGG TCGGTGACGG TATCGCCCGC 
ATCTACGGCC TGGACCGGGC CATGGCCGGC GAGCTGCTGG AGTTCCCCGG CGATATCTAT 
GGCATGGTCC TGAACCTGGA AGAAGATAAC GTCGGCGCCG TTATCCTCGG TCCCTATACC 
CATATCAAAG AGGGCGACCA GGTCAAACGT ACCGGGCGTA TTGTCGAGGT GCCGGTGGGC 
GAAGCCCTCA TCGGCCGGGT GGTCAACGCC ATGGGCCAGC CCATAGACGG CAAGGGGCCT 
ATCCAGACGG ATAAATTCCG CCCGGTGGAA TCCCCGGCGC CGGGCGTGGT CTACCGCCAG 
CCGGTCAATA CTCCCTTACA AACGGGCCTC AAGGCCATTG ACTCCATGGT CCCCATCGGC 
CGCGGTCAGC GGGAGCTGAT TATCGGTGAC CGCCAGACGG GGAAGACGGC CATTGCCGTG 
GACACCATCA TCAACCAAAA GGGGCAGAAC GTTATCTGCA TCTATGTGGC CATCGGCCAG 
AAGGCTTCTA CAGTGGCGGG CGTAGTCCAG CGTCTGGAAG AGGCCGGAGC TATGGAATAT 
ACCATCGTCG TTATGGCTAC AGCCAGCGAA CCGGCGCCCA TGCTCTACAT TGCCCCCTAC 
GCCGGCTGCA CCATGGGCGA ATACTTTATG TATGAGCAGC ACCGGGACGT TCTCTGCGTT 
TATGACGACC TTTCCAAGCA CGCAGCAGCC TACCGGGAAC TCTCCCTGCT TCTGCGGCGG 
CCGCCGGGCC GTGAGGCTTA CCCCGGGGAT GTCTTCTATC TCCACTCCCG GTTGCTGGAG 
CGGGCCGCCC GCCTGAACGA CTCCCTGGGT GGCGGTTCCC TCACTGCCCT GCCGGTCATT 
GAGACCCAGG CTGGCGATGT CTCCGCTTAC ATTCCGACCA ATGTTATCTC CATCACCGAC 
GGCCAGATCT TCCTGGAGTC TGATCTCTTC TATGCCGGCC AGCGTCCGGC CATTAACGTC 
GGCCTCTCGG TATCCCGGGT GGGCGGCGCC GCCCAGATCA AGGCCATGAA ACAGGTGGCC 
GGCCGCCTGC GCCTGGACCT GGCCCAGTAC CGCGAGCTGG CGGCCTTCGC CCAGTTCGGT 
TCCGACCTGG ATAAAGCCAC CCAGGCGAGA TTGGCCCGGG GCGAGCGCAT GATGGAGATT 
TTGAAACAAG ACCAGTACCA ACCCATGCCC GTCGAAGAAC AGGTGGTCGT CCTCTATGCT 
GCCGTCAATG GCTTCCTGGA CGACCTGCCT GTAGCCCGGG TGCGCGCCTT TGAAAAGGAC 
TTCCTGCGCT TCCTCCGCAA CGAGAGGCCT GAGGTCCTGG CCGGCATCCG CGAAAAACGC 
CAGCTGGACG ATAACCTCCA GGAACAACTG AAAAAGAGCA TTGAAGACTT CAAAGGCAGC 
TTTACCGCTG CCGGAGAATC ATAA

Protein sequence

MSIRPDEITS ILKNQIEQYQ LEVEMAEVGT VTQVGDGIAR IYGLDRAMAG ELLEFPGDIY 
GMVLNLEEDN VGAVILGPYT HIKEGDQVKR TGRIVEVPVG EALIGRVVNA MGQPIDGKGP 
IQTDKFRPVE SPAPGVVYRQ PVNTPLQTGL KAIDSMVPIG RGQRELIIGD RQTGKTAIAV 
DTIINQKGQN VICIYVAIGQ KASTVAGVVQ RLEEAGAMEY TIVVMATASE PAPMLYIAPY 
AGCTMGEYFM YEQHRDVLCV YDDLSKHAAA YRELSLLLRR PPGREAYPGD VFYLHSRLLE 
RAARLNDSLG GGSLTALPVI ETQAGDVSAY IPTNVISITD GQIFLESDLF YAGQRPAINV 
GLSVSRVGGA AQIKAMKQVA GRLRLDLAQY RELAAFAQFG SDLDKATQAR LARGERMMEI 
LKQDQYQPMP VEEQVVVLYA AVNGFLDDLP VARVRAFEKD FLRFLRNERP EVLAGIREKR 
QLDDNLQEQL KKSIEDFKGS FTAAGES