Gene Moth_1160 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1160
Symbol
ID	3833128
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1192827
End bp	1194509
Gene Length	1683 bp
Protein Length	560 aa
Translation table	11
GC content	52%
IMG OID	637829091
Product	metallophosphoesterase
Protein accession	YP_430017
Protein GI	83590008
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00000153415
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAGT TTGCTGCCCT CTTCCTGGCT GTAGTTATAG CCGTGACTAT GCTGGCGGCC 
CCGGCTGCTT CCTCTGCCGC TGGCACCCCC CAGTATGATC TAGGTGCTTC GGCCCAACCG 
GATCATATTA CCCTCACCTG GACCCAAGAT CCCCTGACAA CCCAGACCAT TACCTGGAGA 
ACTAACATTA CTATAGCCAG GGGGCTTGTC CAGTATGCCA AAGCCGCGGA TAAGGCCTCT 
TTCCCCGGCA AAGCCGCTAC CGTAGAAGCT ACAGTGCAGA AGTTTACCTC CGATCTGGGG 
GATATGAACA TCCATACCGC CACCCTTACC GGCCTCGAAC CCGGCACCGA GTATATCTAT 
AGGGTTGGCG ACGGCACCAA CTGGAGCGAC ATCCACACCT TCACCACAGA AGCCAGCAAC 
ACTCACTCTT TCAAATTCCT TATCTTTGGC GACAGCCAGA GCGGCGACCC CCTAAATCCG 
GAATATAAAC CCTGGCACGA TACCATCCAG AACGCCTTCA AAACTAACAC CGACGCTAAA 
TTCTTTGTCA ATGTCGGCGA CCTGGTCGAA CAGGGACAGA ATTATGTCCA CTGGAATAAA 
TGGTTCGAGG CCGCCAAAGG TGTTATTGAT ACCATCCCGG CCATGGCCAC CCAGGGCAAC 
CACGAGACTT ACAACCCGCC TGATGGCCAT TCAACTAAAC CGATTTTTTG GACTACCCAG 
TTCAAACTGC CCCAGAACGG CCCGGAGGGC CTGAAAGGCC AGGCTTATTC CTTTGATTAT 
GGGAACGCCC ATATTGTAAT GCTCGACAGC CAGGAAGAAG AAGAAAAGGG TGTGGCCGGG 
GATATTCTGG CGGCCCAAAA GGCCTGGCTG GAAAAAGACC TTCAGAATAC CAATAAGCCC 
TGGAAACTGG TCTTCTTCCA TAAAACACCT TATTATAATA AGGCTACCCG TACCAACGAA 
GATATTAAAG CCGCCTTCCA GCCCCTCTTC GATAAATACC ACGTTGACGT AGTTTTTAAC 
GGCCACGACC ATGCCGTCGC GCGGACCTAC CCCATAGCCG GCGATAAGTT TGTCAGCAGC 
CCGGCTAAAG GCACCATCTA CTATCTCACC GGTAGAAGCG GTAATAAGTA TTACCCCGAC 
CTGTCGGCCA AGGTATGGGA CGCCTTCTTC TACGACCCTC AAGATCAACC CAACTATATT 
GTAGCTGAAT TGAATGGGGA TAAATTGACC CTCAGGGCTA TGAAGCAAGA TGGCACCCCC 
ATCGATACCT ACACCATCGA TAAAGCCAGC GGGCTGGATA CGCCCCAGAC TATTGTCCCG 
CCTAAATATA ACTCCACCAG GTTGGTGATC TTCGGTAACA TGCTCCAGCA GCCCCTGCTG 
CCGGTAACCC CCAAGCAGGT CAATGGCCAG TGGTATATCC CCGTAAGGGC CTTTATGCAG 
TTCCTGGGCG GCAATGTGGC CTGGTATGAT GACGGCAGCG TAACCATCGT TTATGGTAAA 
GACAAGGTGC AAATGGCCAG CAAGAGCGCC CGGGCCACCA TCAACGGCCA GGAAGTAAAC 
CTGCCCGGCA GTAGCCTGAT GGACAAAAAT ACTCTTTTTA TACCGGCTGC CGACCTGGAG 
GAATTCTTTG GTTTCAGCTA CAAGTATGAT GCCGCCACCA ATATGCTGAT GTTTACCAAA 
TAA

Protein sequence

MKKFAALFLA VVIAVTMLAA PAASSAAGTP QYDLGASAQP DHITLTWTQD PLTTQTITWR 
TNITIARGLV QYAKAADKAS FPGKAATVEA TVQKFTSDLG DMNIHTATLT GLEPGTEYIY 
RVGDGTNWSD IHTFTTEASN THSFKFLIFG DSQSGDPLNP EYKPWHDTIQ NAFKTNTDAK 
FFVNVGDLVE QGQNYVHWNK WFEAAKGVID TIPAMATQGN HETYNPPDGH STKPIFWTTQ 
FKLPQNGPEG LKGQAYSFDY GNAHIVMLDS QEEEEKGVAG DILAAQKAWL EKDLQNTNKP 
WKLVFFHKTP YYNKATRTNE DIKAAFQPLF DKYHVDVVFN GHDHAVARTY PIAGDKFVSS 
PAKGTIYYLT GRSGNKYYPD LSAKVWDAFF YDPQDQPNYI VAELNGDKLT LRAMKQDGTP 
IDTYTIDKAS GLDTPQTIVP PKYNSTRLVI FGNMLQQPLL PVTPKQVNGQ WYIPVRAFMQ 
FLGGNVAWYD DGSVTIVYGK DKVQMASKSA RATINGQEVN LPGSSLMDKN TLFIPAADLE 
EFFGFSYKYD AATNMLMFTK