Gene Moth_2503 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2503
Symbol
ID	3832775
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2608024
End bp	2609928
Gene Length	1905 bp
Protein Length	634 aa
Translation table	11
GC content	59%
IMG OID	637830426
Product	selenocysteine-specific translation elongation factor SelB
Protein accession	YP_431328
Protein GI	83591319
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG3276] Selenocysteine-specific translation elongation factor
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain [TIGR00475] selenocysteine-specific elongation factor SelB [TIGR00485] translation elongation factor TU

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00650537
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.143065
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACTATA TTGTTGTCGG CACTGCAGGC CATGTCGACC ATGGTAAAAC TGTACTGGTC 
AAAGCCCTGA CCGGTGTTGA CACTGACCGG CTGAAGGAAG AAAAGGAACG GGGCATATCC 
ATCGAACTGG GTTTTGCCCC CCTGACCCTG CCCAGCGGTC GCCAGCTGGG CCTGGTAGAC 
GTACCCGGCC ATGAGCGGTT TATCCGCCAG ATGCTGGCTG GTGTCGGCGG TATGGACCTG 
GTTATGCTGG TAGTAGCCGC CGACGAAGGT GTCATGCCCC AGACACGGGA GCACCTGGCC 
ATTATCGACC TACTCCAGAT TAAAAAGGGT ATTATTGTCA TTACGAAAAT CGACCTGGTA 
GAAGCCGACT GGCTGGAACT GGTCCGGGAA GAAGTCCGCC AGGCCGTAAA GGGAACAGTC 
CTGGAGGATG CGCCCCTGGT AGAGGTATCC GCCCTGACGG GTGAAGGAAT AGCAGAATTA 
CGGGAGCAAC TGGATGCCCT GGCGGCAGTC ACCCCGCCCC GGCCGGCCGC AGGCCGGGTC 
CGGTTACCCA TTGATCGTGT CTTTTCAGTT ACCGGTTTCG GCACCGTAGT CACCGGAACC 
CTCTGGTCGG GAACCATTAA GGTCGGGGAT GAACTGGAGG TTCAACCGGA AGGCCTTAAG 
ACCAGGGCCA GGAACCTCCA GGTTCACGGA CGAACGGTAA AGGAGGCCCG AGCCGGCCAG 
CGGGTCGCGG TGAACCTGGC TGGTATCGAA ACGGAGGCCG TCCACAGGGG CAGTTCGCTC 
CTGACACCAG GCTTTTTAAC CCCCACCTAT CGCCTGGACG CCAGCTTTAA ACTACTTAAC 
GGGGCCCGTC CTCTGGCCAA TCGCGATCGA GTACATTTCT ACCTTGGCAC CAGCGAAGCC 
CTGGGACGGG TAGTATTACT CGACCGGGAC GAGTTGAACG GGGGGGAAGA AGCCCTGATT 
CAGCTTCTGA TGGAAAAACC GGTGGTGGCC AGCCGTGAGG ATCGCTTTAT CTTGAGGAGC 
TATTCGCCCA TGGAGACCAT CGGCGGGGGC ATTATTATTG ACCCCGTTCC CCCCAAGCAC 
CGGCGCTTTC AACCGGAGGT TCTGGTCTCT CTCCAGAGGC GCCTGGAGGG TTCCCCGGAA 
AAAATTCTGG CCCAGATAAT CCAGGAACAC CGGGAGGGAC TGGACTGGCA GGAGGCAGCA 
ACCAGGGCCT CACTATCCCT GGAAGAAACC CGGAAACTGC TTCAGTCGAT GGCCGCAGCC 
GGTCAGGTTA CTCTGCTACG GGTGGAGAAT GATCTCTACG CCATCAGTAC CGAGCGTTAT 
CAGGCCTGGT GGCAGGCGGT GACCCGGGCC CTGGAAGAGT TTCACAGCCG TTATCCCCTG 
CGGCCTGGCC TGGCCAGGGA GGAGTTGCGT TCGCGGTATT TCTCCCGCCT CCCGGCCCGG 
GTTTATCAGG CTTTGTTGGA AGAGTGGTCC AGGGAAGGCC GCCTGCAGCT CGCGGCCAAC 
ACTGTAGCCC TGGCCGGCTT TACTCCCAGT TTCAGCGAGA CGCAAAAGAA GCTTCTAAAA 
GACCTGGAAG ATAAATACCG GGTTTCCCGC TGGCAACCGC CTTCCTTTAA GGAAGTGGCG 
GGAAGCTTTA ATCTCGACCC GTCAGAACTG GAGGAACTCC TTCACTACCT GGTGCGGGAG 
GGTGTCCTGG TAAAAATTAA TGACGAGTTT TACTGGCACC GGCAGGCACT GGGGGAAGCC 
CGGGAAGTGA TTAAAAACCT TGCCAGCACG GGTCCCTTTG GGCTGGCCGA GGCCAGGGAC 
GCTCTGGGCA GTTCCCGGAA GTATGTTTTG CCCCTGCTGG AATACCTGGA TCAGGTGAAA 
TTTACCCGGC GCGTGGGGGA CAAGCGGGTA GTTGTTGGTA ATTGA

Protein sequence

MDYIVVGTAG HVDHGKTVLV KALTGVDTDR LKEEKERGIS IELGFAPLTL PSGRQLGLVD 
VPGHERFIRQ MLAGVGGMDL VMLVVAADEG VMPQTREHLA IIDLLQIKKG IIVITKIDLV 
EADWLELVRE EVRQAVKGTV LEDAPLVEVS ALTGEGIAEL REQLDALAAV TPPRPAAGRV 
RLPIDRVFSV TGFGTVVTGT LWSGTIKVGD ELEVQPEGLK TRARNLQVHG RTVKEARAGQ 
RVAVNLAGIE TEAVHRGSSL LTPGFLTPTY RLDASFKLLN GARPLANRDR VHFYLGTSEA 
LGRVVLLDRD ELNGGEEALI QLLMEKPVVA SREDRFILRS YSPMETIGGG IIIDPVPPKH 
RRFQPEVLVS LQRRLEGSPE KILAQIIQEH REGLDWQEAA TRASLSLEET RKLLQSMAAA 
GQVTLLRVEN DLYAISTERY QAWWQAVTRA LEEFHSRYPL RPGLAREELR SRYFSRLPAR 
VYQALLEEWS REGRLQLAAN TVALAGFTPS FSETQKKLLK DLEDKYRVSR WQPPSFKEVA 
GSFNLDPSEL EELLHYLVRE GVLVKINDEF YWHRQALGEA REVIKNLAST GPFGLAEARD 
ALGSSRKYVL PLLEYLDQVK FTRRVGDKRV VVGN