Gene Moth_1287 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1287
Symbol
ID	3831550
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	1326852
End bp	1328051
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	57%
IMG OID	637829224
Product	Beta-lactamase-like
Protein accession	YP_430144
Protein GI	83590135
COG category	[C] Energy production and conversion
COG ID	[COG0426] Uncharacterized flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0000705459
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCCAGC CTGTCGCCAT TACCGACGGC ATCTACTGGG TAGGGGCCGT TGACTGGAAC 
ATCCGCTACT TCCACGGTCC CGCTTTTTCC ACCCACCGCG GTACAACTTA TAATGCCTAT 
CTGATTGTCG ACGATAAAAC CGCCCTGGTG GATACTGTCT ATGAACCCTT TAAAGAAGAA 
CTCATTGCCA AACTAAAGCA AATAAAAGAT CCGGTTAAAC TCGACTACCT GGTGGTCAAC 
CATACCGAAA GCGATCATGC CGGCGCCTTC CCGGCCATCA TGGAACTCTG TCCAGACGCC 
CACGTCCTCT GCACCCAGCG GGCCTTTGAC AGCCTGAAAG CCCATTATAG CCACATCGAT 
TTCAACTATA CCATTGTCAA AACCGGGACC AGCGTCAGCC TGGGTAAACG CTCCCTGACC 
TTCATCGAGG CGCCCATGCT CCACTGGCCC GACAGCATGT TTACCTATGT ACCGGAAGAA 
GCCCTGCTCC TTCCCAATGA TGCCTTCGGC CAGCATATCG CCACCAGCGT CCGCTTCGAC 
GACCAGGTGG ATGCCGGCCT GATTATGGAC GAGGCGGCCA AGTACTATGC CAATATTCTC 
ATGCCCTTCA GCAACCTGAT TACCAAAAAG CTGGATGAAA TCCAGAAGAT AAACCTGGCC 
ATCAAAACCA TAGCCCCCAG CCACGGCATT ATCTGGCGTA AAGATCCCGG CCGAATCATC 
GAAGCTTACG CCCGCTGGGC CGAGGGTCAG GGTAAGGCCA AAGCCGTCAT CGCCTACGAC 
ACCATGTGGC TGAGCACAGA AAAGATGGCC CACGCCCTGA TGGACGGCCT GGTGGCCGGC 
GGCTGCGAGG TCAAGCTCTT CAAGCTGTCC GTATCCGACC GCAACGATGT GATCAAAGAA 
ATTCTGGACG CCCGAGCCGT CCTGGTCGGC TCGCCGACGA TCAATAACGA TATCCTGCCG 
GTGGTCTCGC CGCTCCTGGA CGACCTGGTA GGATTAAGGC CCAAGAATAA AGTTGGCCTG 
GCCTTCGGCG CCTATGGCTG GGGCGGCGGC GCCCAAAAGA TCCTGGAAGA ACGCTTGAAG 
GCAGCTAAAA TCGAACTGAT AGCCGAGCCC GGCCCCACCG TCCAATGGGT TCCCCGTGGC 
GAGGACCTGC AGCGCTGCTA CGAGCTGGGC CGGAAAATCG CAGCGCGCAT AGCCGATTAA

Protein sequence

MSQPVAITDG IYWVGAVDWN IRYFHGPAFS THRGTTYNAY LIVDDKTALV DTVYEPFKEE 
LIAKLKQIKD PVKLDYLVVN HTESDHAGAF PAIMELCPDA HVLCTQRAFD SLKAHYSHID 
FNYTIVKTGT SVSLGKRSLT FIEAPMLHWP DSMFTYVPEE ALLLPNDAFG QHIATSVRFD 
DQVDAGLIMD EAAKYYANIL MPFSNLITKK LDEIQKINLA IKTIAPSHGI IWRKDPGRII 
EAYARWAEGQ GKAKAVIAYD TMWLSTEKMA HALMDGLVAG GCEVKLFKLS VSDRNDVIKE 
ILDARAVLVG SPTINNDILP VVSPLLDDLV GLRPKNKVGL AFGAYGWGGG AQKILEERLK 
AAKIELIAEP GPTVQWVPRG EDLQRCYELG RKIAARIAD