Gene Moth_2502 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2502
Symbol
ID	3832774
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2606749
End bp	2607948
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	53%
IMG OID	637830425
Product	extracellular ligand-binding receptor
Protein accession	YP_431327
Protein GI	83591318
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.101059
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.128771
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGGAGAC TGAAAAAAGT TGCTTTGATG GCCCTGGCCT TAATCCTGGC AGTAGCTTTA 
ATCGCCGGCT GCGGCCAGCA AAAATCGGGG GCAGAAAAAC AGGGTGCTAC GGGCGGCAAT 
ACAATTAATA TCGGCGTCAA TTATGAACTC TCAGGCGATG TAGCTACTTA TGGTACTAAT 
TCCAAGGACG CCATCCTGCT GGCCTTTGAA GAGATTAACC AGAAGGGTGG TGTCCTGGGC 
GGCAAAAAGA TTAATGCCAT CGTCCTGGAC AATGGCGGTA AAAAAGAAGA AGCCATGAGT 
GCGGCCGCGA AATTGATTAC CGAGAATAAG GTCGTCGCCC TCCTGGGCCC GGCTACATCC 
GGCGCCACCA TGGCGGCTTC GACTATGGCT ACAAAATATA AAGTACCGAT TATCAGCCCT 
TCGGCGACGA GTCCCGATGT GACTGTCGAT CCCCAGAGCA AGAAGGTTCG CGACTACGTT 
TTCCGCGTTT GCTTTATCGA TCCCACCCAG GCCATTGTGG GCGCAGAATT CGCTACCAAG 
GATCTGGGGG CCAAAAAGGC AGCCATTATT TATAGCAACT CTGATGAGTA CAGCAAGGGG 
TTATACAAGG TCTTCAAAGA GGAATTCGCC AAAGACGGCG GCCAGGTAGT GGCGGAAGAG 
AGCTTTAACT CCGGCGATCA GGATTTCCGC CCCGCCCTGA CCAGGGTCAA GGATGCCGGC 
GCCGACCTGA TCTATGTACC GGCCTATTAC GGTGATGTTG GAAAAATCGT TAACCAGGCC 
CGGGAGCTGG GTATCAAGGT CCCCATGCTG GGTGCCGACG GCTGGGATTC CCCCAAGCTG 
GCTGAGTACG CCGGCGGAGC AGCCAACCTG AATAATACCT ACTTCACCAA CCATTACGCC 
GCCAGCGACC CCAACCCGCG GCTTCAGGCC TTCATCAAGG CCTTTAAAGC AAAATACAAC 
AAAGAGCCGG ACGCCTTCGC TGCCCTTGCC TACGATACAG CCTACCTGCT GGCTGATGCC 
ATCAATCGGG CCGGGTCGGC CGATCCGGAG GCCATCCGCA ATGCCTTGGC CAGTACGAAG 
GATTTTGAAG GCATTACCAG TAAGATCACC ATAGATCAAA ACCACAACCC TGTTAAAGAT 
GTAGCCATTA TTGCCATGGT AGACGGCAAG CAGACCTTAA AGAAAAAGAT TACGCATTAA

Protein sequence

MGRLKKVALM ALALILAVAL IAGCGQQKSG AEKQGATGGN TINIGVNYEL SGDVATYGTN 
SKDAILLAFE EINQKGGVLG GKKINAIVLD NGGKKEEAMS AAAKLITENK VVALLGPATS 
GATMAASTMA TKYKVPIISP SATSPDVTVD PQSKKVRDYV FRVCFIDPTQ AIVGAEFATK 
DLGAKKAAII YSNSDEYSKG LYKVFKEEFA KDGGQVVAEE SFNSGDQDFR PALTRVKDAG 
ADLIYVPAYY GDVGKIVNQA RELGIKVPML GADGWDSPKL AEYAGGAANL NNTYFTNHYA 
ASDPNPRLQA FIKAFKAKYN KEPDAFAALA YDTAYLLADA INRAGSADPE AIRNALASTK 
DFEGITSKIT IDQNHNPVKD VAIIAMVDGK QTLKKKITH