Gene Moth_0710 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0710
Symbol
ID	3832711
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	742119
End bp	743303
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	64%
IMG OID	637828641
Product	peptidase
Protein accession	YP_429571
Protein GI	83589562
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID	[TIGR03526] putative selenium metabolism hydrolase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.00268178
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0281992
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGACAG AAGCCAGGCG CCGTGAGGTG CTGGAATTGG CGCGGCAGTT GCTGAGGATA 
CCCAGCCTTT CCGGCAAAGA AAAATGGGTG GCCAGGGCCA TCCGGGAGCG GATGCAAGAG 
TTTGGGTACG ACGAGGCGCG GATTGACAGC CTGGGGAATG TTATTGGTAT TATTCGCGGC 
CGGCGGCCAG GTCCCTGCCT CCTCTTCGAC GGTCACATGG ATACTGTTGC TGCCACCGGG 
GAAGGCTGGC GCCATGATCC CATCGGCGGC GAGGTGCAGG ACGGCAGGCT CTATGGCCGC 
GGCGCTTCCG ACATGAAAGG AGCCCTGGCG GCTATGGTAG CCGCCGCCGG TTACTTTGCC 
CATGACCGGG AGCGGGATTT CGCCGGTACC CTGGCGGTGG CCGGCACCGT CCATGAGGAA 
TGCTTTGAAG GGGTGGCGGC CAGAGAGGTT TTTAAGGCCG TTAGGCCTGA TTATGTGGTT 
CTCGGCGAGG CTTCGGAATT AAACCTGAAG CGCGGCCAGC GGGGCCGGGC GGAGATCGTC 
ATCACTACCC GGGGCCGTGC CGCCCATTCA TCCAACCCCG GGGCGGGGAA TAATGCCGTC 
TACCAGATGG TCGAGGTGGT CCGCCGCCTG CGGGAGCTGG AGCCGCCCCT GCATCCGGTC 
CTGGGGCCTG GGATTCTAGA GCTGACGGAT ATTATTTCCG CGCCTTATCC CGGAGCTTCG 
GTGGTTCCTG ATACCTGCCG GGTTACCTAC GACCGCCGCC TGCTGGTAGG AGAGACCAGG 
GAGGGGGTAC TGGCTCCCAT TCGTAAGGTT CTCGATGAGC TGGCGGCATC TTGCCCCGGT 
TTCCGGGCCG AGGTCGCCTT CGCCCGGGGT GAGGGTAAGT GCTATACCGG CGCCCACCTC 
GCCAGCGAGC GCTTTTATCC CGGATGGCTG CTGCCGGATG ATCATGAACT GGTGCGCCGG 
GCCCTGGCCG GCCTGCGGGC TGCCGGCCTG CAGCCGGCTT TAAGCCATTA CTCCTTCTGC 
ACCAACGGTA GCTTTTACGC CGGCGAAGCC GGGGTGCCCA CCATCGGCTT TGGTCCTTCC 
CGGGAAGAAC TGGCCCATGT GGTTGATGAA TACATTGAGC TGGAACAGCT CTGGGCCGCG 
GCAACGGGTT ATTACGCCCT GGCCGGCGCC CTCCTGGCTC CTTAA

Protein sequence

MLTEARRREV LELARQLLRI PSLSGKEKWV ARAIRERMQE FGYDEARIDS LGNVIGIIRG 
RRPGPCLLFD GHMDTVAATG EGWRHDPIGG EVQDGRLYGR GASDMKGALA AMVAAAGYFA 
HDRERDFAGT LAVAGTVHEE CFEGVAAREV FKAVRPDYVV LGEASELNLK RGQRGRAEIV 
ITTRGRAAHS SNPGAGNNAV YQMVEVVRRL RELEPPLHPV LGPGILELTD IISAPYPGAS 
VVPDTCRVTY DRRLLVGETR EGVLAPIRKV LDELAASCPG FRAEVAFARG EGKCYTGAHL 
ASERFYPGWL LPDDHELVRR ALAGLRAAGL QPALSHYSFC TNGSFYAGEA GVPTIGFGPS 
REELAHVVDE YIELEQLWAA ATGYYALAGA LLAP