Gene Moth_1254 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1254
Symbol
ID	3833049
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	1297449
End bp	1298495
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	58%
IMG OID	637829190
Product	Beta-lactamase-like
Protein accession	YP_430111
Protein GI	83590102
COG category	[R] General function prediction only
COG ID	[COG2333] Predicted hydrolase (metallo-beta-lactamase superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.104793
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.017013
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGACAT TAAGCATTCT GGCCCTGCTG GTGGCCGTTT TGCTAACAGT AAACTCCGGC 
TGGTACTTTA TCCGCCGCGC CGGTAAAAAA GCCAGGCGCC AGGCCCTCTA TGCCCTCCTG 
GCGTTTATCA TTTCCGTAGC GGCAGCTGCC GGCCATCCCG GTGGAGGTCC GGGCCCGTCC 
GGCAGCCTAC AGTCCCAGCC ACGCAGCCAG GCCCAGGCCC CTGTGCAGGC GCCAGCCGGT 
ACACCCCTGT CGCGGGAATC TCAGACGAAC CCTTCTCCAC GCCGGGAAGA AGCCGGTAAA 
TTACGCGTCC ATTTCCTGGA TGTAGGCCAG GGTGATGCCA TCCTGGTGCA ATTGCCCGGC 
GGCCAGAATA TTTTAATCGA TGCCGGCACC AATGAAGCCG GTCCTGTTGT GGTCCAGGAC 
CTGAAACAGT ATGCCGTTGC AAAACTTGAT TATGTCATCG GGACCCATCC CCATGAAGAC 
CATATTGGCG GCCTGGACCA GGTCATCAAT ACTTTTCCGG TAGGCAAGGT TTACCTGCCC 
AGGGTGACCA ATAATACGGC TTCCTACAGG GAACTGCTGC TGGCAATAAA AAACAAGGGC 
CTCAAGGTTA CAGAGGCCCG GGCCGGAGTT AGCATCCCCC TGGGCGACGG CGTCCAGGCC 
CTTTTTATCA ACCCGGCGAA GAAAAACTAT GATGACTTGA ATGACTGGAG CGCCGTCCTG 
CGCCTGACTT ATGGGCAAAC CTCTTTTCTC TTTACCGGCG ATGCTGGCAG CGCCGCCGAG 
GAAGAGATGC TGGCCAGCCA CCAGCCCCTC AGGGCCGATG TGCTTAAAGT AGCCCACCAT 
GGCTCCCGTA CCGCCACCGG CACCGCCTTT TTAAAGGCCG TAGCACCTGC ATACGCCGTC 
ATCTCCGTCG GTAAAGGAAA TGACTACGGC CATCCCCATG CCCAGACCCT TAAGCGCTTG 
CAACAGGCCG GGGTTAAGGT ATATCGCACC GACCGCGATG GTACCATAAC GGCCGTCTCC 
GACGGCCGGG AGGTAATCAT GCCCTGA

Protein sequence

MMTLSILALL VAVLLTVNSG WYFIRRAGKK ARRQALYALL AFIISVAAAA GHPGGGPGPS 
GSLQSQPRSQ AQAPVQAPAG TPLSRESQTN PSPRREEAGK LRVHFLDVGQ GDAILVQLPG 
GQNILIDAGT NEAGPVVVQD LKQYAVAKLD YVIGTHPHED HIGGLDQVIN TFPVGKVYLP 
RVTNNTASYR ELLLAIKNKG LKVTEARAGV SIPLGDGVQA LFINPAKKNY DDLNDWSAVL 
RLTYGQTSFL FTGDAGSAAE EEMLASHQPL RADVLKVAHH GSRTATGTAF LKAVAPAYAV 
ISVGKGNDYG HPHAQTLKRL QQAGVKVYRT DRDGTITAVS DGREVIMP