Gene Anae109_3235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_3235
Symbol
ID	5376542
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	-
Start bp	3789170
End bp	3791533
Gene Length	2364 bp
Protein Length	787 aa
Translation table	11
GC content	72%
IMG OID	640844757
Product	sulfatase
Protein accession	YP_001380413
Protein GI	153006088
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGCTG AGAAGAACGG CTTTCCGAGG CACGTGGAGC GCGAGGTCTA CCCGAAGCCG 
GAGCACCGCT TCGCCGGCGC GAAGATCGGC CTCACGCACG AGGACTCGCG CCCCGACTAC 
CCGGCGCCCG AGCAGGCGCC GCCGCACGCG GCGAACGTGG TGATCGTGCT GCTCGACGAC 
GCCGGCTGGG CGGTGTCGAG CGCGTACGGG GGGCTCTGCC GGATGCCGAC GGCGGAGCGG 
CTCGCTCGCG AAGGGCTGCA GTACTGCGCG TTCCACACGA CGGCGCTGTG CGCGCCGACG 
CGCGCGGCGC TGCTCACCGG CCGGAACCAC CACTCCGCCG CGACGGGTGT CGTGGCCGAG 
ATGGCGACCG GCTATCCCGG CTACTCGGGG ATGATCCCGC GGAGCTGCGC GATGATCTCG 
GAGATCCTGT CGCAGAACGG CTGGGCGACG GGCTGGTGGG GCAAGAACCA CAACGTGCCC 
GATGGTCACA CGAGCGCGGC CGGGCCGTTC GACCACTGGC CGAGCCGGCG TGGCTTCGAC 
TACTTCTACG GGTTCGTCGG CGGCGAGACG GATCAGTTCT ATCCCGCGCT GTATCGCGAC 
ACGACGCCCG TCGCGCCGCC GAGGACACCG GAGGAGGGGT ATCACCTCAC CACGGACCTC 
GCGGACGACT GCATCGCCTG GATGCGCCGC CAGAAGGCGA TCGCGCCGGA GCGACCGCTG 
TTCGTGCACT TCGCGCCCGG CGCCGTCCAC GGCCCGCACC AGCCGCCGCT CGCGTGGCGC 
GGCCGCAACG CGGGGCGGTT CGACATGGGC TGGGACCGCT GCCGCGAGCT CGTCCACGCG 
CGCCAGCTCG AGCTCGGCGT CATCCCCCCC GCAACGCGCC TGACGCCGCG CCCCGCGGAG 
CTGCCGGCCT GGGACTCCTT CGGTCCGGAG GAGCGGCGGC TCTTCGCGCG CCAGATGGAG 
AACTTCGCCG ACTTCCAGGA GCACACCGAC TTCGAGGTCG GCCGCCTCGT CGAGGCGCTC 
GAGGCGCTCG GCGAGCTCGA GAACACGCTC TTCCTCTACA TCCTCGGCGA CAACGGCTCG 
AGCGCGGAGG GGAGCCTCCA CGGCACGATC AACGAGACGG CGTCGATGAG CGGCGTCGAG 
CCGCCGCTCG CGCAGACCCT CGCGCGCATC GACGAGATCG GGCTCCCCGG GACCTGGCCG 
CACTACGCCG TGGGCTGGGC GTGGGCGGGC GACACTCCGT ACCAGTGGGT GAAGCAGGTC 
GCCTCGCACT TCGGCGGGAC GCGCAACGGC CTCGTCGTGA GCTGGCCCGC GTGGATCGCG 
GATCGCGGCG CGAAGCGGTT CCAGTTCCAC CACGTCGTGG ACGTGGTGCC GACCCTGCTC 
GAGGTGGCCG GGATCGCGGA GCCGGCGATG GTCGACGGCG TGACGCAGAA GCCGATCGAG 
GGCGTCAGCA TGGCCTACAC GTTCGACCGG CTGAACGCGG ACGCGCCCAC CCGCAAGGAG 
ACGCAGTACT TCGAGATGCT CGGCAATCGC GGCATGTACC GCGACGGCTG GTTCGCGGCC 
TGCCGCCACG GACGGCTCCC GTGGGAGACG AGCGGCAGCG CCGACTTCGC CGAGGACCGC 
TGGGAGCTGT ACGACCTGCG CGACGACTTC AGCCAGGCCG AGGACCTCGC GGCGCGCCAT 
CCGGAGAAGC TGCGCGAGCT GCGGGACCTG TTCCTCGCCG AGGCCGCGAA GCACGGGGTG 
CTGCCGCTCG ACGACCGCTT CGTGGAGCGG TCCGATCCGT CGCTGCGCCC CGGGTTCTTC 
ACCGGGCGGA CCCGGCTGGT GCTCGATCCC GGCCTCGTGC GGCTGCCGGA GGGCAGCGCG 
CCGCGGACGG CGAACGTGGA CCACGTCCTC ACGGTCATGG CCGAGCTCCC GGAGGGCGGC 
GCGGAAGGCG TCCTCGCCTG CATGGGCGGG GACTGCTCTG GGTGGACGCT GTTCGTCGAC 
GGCGGCCGGC TCCGCTACCA CTACAACCGC TTCGACTACG ATCGGTACGA CGTCGTCTCC 
GACGCGCCGC TCCCGGCCGG CCGCGTGGAG CTGCGCCTCG AGTTCCGGTG CGACGATCCG 
CGCAAGCGGG GAGGCGGCGC GACGGTGCGG CTCCTCTGCG ACGGCCGCGT CGTCGGCGAG 
GGGCGGGTCG AGAAGCAGGT GACCGGCAGG TTCGGGGAGT GCTTCGACGT GGGGCAGGAC 
TCGCTCTCGC CGGTGTGGGG CGGCTACCGC GATCGCCTCC CGTTCCGGTT CACGGGGATC 
ATCCAGCGCG TCCACCTCGA GCTCGGCGAG GCGGCGGAGC CGACCGCGGC GGAGCGGCTC 
GAGGAGCAGA TCCGGTTCGA CTGA

Protein sequence

MAAEKNGFPR HVEREVYPKP EHRFAGAKIG LTHEDSRPDY PAPEQAPPHA ANVVIVLLDD 
AGWAVSSAYG GLCRMPTAER LAREGLQYCA FHTTALCAPT RAALLTGRNH HSAATGVVAE 
MATGYPGYSG MIPRSCAMIS EILSQNGWAT GWWGKNHNVP DGHTSAAGPF DHWPSRRGFD 
YFYGFVGGET DQFYPALYRD TTPVAPPRTP EEGYHLTTDL ADDCIAWMRR QKAIAPERPL 
FVHFAPGAVH GPHQPPLAWR GRNAGRFDMG WDRCRELVHA RQLELGVIPP ATRLTPRPAE 
LPAWDSFGPE ERRLFARQME NFADFQEHTD FEVGRLVEAL EALGELENTL FLYILGDNGS 
SAEGSLHGTI NETASMSGVE PPLAQTLARI DEIGLPGTWP HYAVGWAWAG DTPYQWVKQV 
ASHFGGTRNG LVVSWPAWIA DRGAKRFQFH HVVDVVPTLL EVAGIAEPAM VDGVTQKPIE 
GVSMAYTFDR LNADAPTRKE TQYFEMLGNR GMYRDGWFAA CRHGRLPWET SGSADFAEDR 
WELYDLRDDF SQAEDLAARH PEKLRELRDL FLAEAAKHGV LPLDDRFVER SDPSLRPGFF 
TGRTRLVLDP GLVRLPEGSA PRTANVDHVL TVMAELPEGG AEGVLACMGG DCSGWTLFVD 
GGRLRYHYNR FDYDRYDVVS DAPLPAGRVE LRLEFRCDDP RKRGGGATVR LLCDGRVVGE 
GRVEKQVTGR FGECFDVGQD SLSPVWGGYR DRLPFRFTGI IQRVHLELGE AAEPTAAERL 
EEQIRFD