Gene Amuc_0864 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0864
Symbol
ID	6274304
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	1032239
End bp	1033957
Gene Length	1719 bp
Protein Length	572 aa
Translation table	11
GC content	59%
IMG OID	642612919
Product	sulfatase
Protein accession	YP_001877478
Protein GI	187735366
COG category	[R] General function prediction only
COG ID	[COG2194] Predicted membrane-associated, metal-dependent hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.218457
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	72
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCCTC CCCATGCATC CGCCGGTTCC GCAGAACGGT ATCCGTCCGC ATACGGCCTG 
TCGGCCGCTG TCTGCCAGGC TCTGCGCGCC GCGTTCATTC CCCGCCGCAT GCGCTGCCTG 
TGGGCAGCCG GGCTTGCGGC GGCGCTGGCG GCCAATCCCT ATGTGCTCAA CGATGGCCAA 
AGCCTGCTGA TGAGCAGCAT GGGCATCGCC TGCTCCGCAT CCCTGCTCTG CGGCACCATT 
CTTCTCTGCC TGAAATACCG CTTCACCGCC TATGTCCTTC TTCCCGCCAT CATTCTGTTC 
AATGCGGGCC TGTACATGAT GCAGATGCGG TACGGATTGG TCCTGAACCT TTCCGTGCTT 
TCCAGCATGG CGGAGACCAA TTTCCAGGAA GCCTGCGCCT TCTGCACCCC CGCTTCCATT 
GCAGGAACCC TGCTTCTGGC CGGGTTTATC TACCTGGCCA TCTACTGGAG CCGCCGTTCC 
CTGCGTCAAA AAGCCACGTG GGGTGCACTG GCATGCATTT GGGGCCTGTA CGCGGCCCTT 
CTGCTGCTGA GCATTCCGGC AGCCTCCTAC AGCTTGGAAC CCCTTTATCT TTACTACACG 
TCTGACAAGG CCAAAGGCTG GCCTCTCGTG GATATTGCAA TGACGTGCAA ACTGGCGGAC 
GAATACATCA CCCAGGATGC GGGGCGTTTC AACACATTGC GGAATCTTCC GTCCTGCGCG 
GAGCCCCTTT CCCAGTGCGA AGCCCCAGAC GACCTGGCCG TGGTTTTCCA CATGGGGGAG 
AGTGTCCGGG GGGACCATCT TCCCCTGAAC GGTTACCATC GGAACACAAT GCCCCGGCTT 
TCCAAAGAAC CCAACGTCGT TTCCTTCCCG CATGCCACTT CCTTTGGCAT CGTGACCAGA 
ATTTCCGCCA TCGGCATGTT TACGGATGCG GAACTGTGCC GCCGCACTCC CGGTCACTCC 
TCCTTCATTG ACCTGTTCAA CAAACACGGA TTCCGCACCG TCCGTATCAT GGACCTGAGC 
GGAGATTCCA TTCATGATTA TTCCCTGGGC ATCCTGACAC GGAACTGCCG TGAACGGAGA 
CAGACGCCGC TCCAGCACCA GACGCCCGGA ATGATGCAGG AACGAACTTC CCTGGTCATG 
GAGGAATCCC TGAAAAACTT CGGCCGCAAC AGGCAGCTTT ATATCATTTA CAATAACGGG 
AGCCATATGG CGTTCAGCTA CCCCGCGCAG GCGGAATGTT TTACCCCGGC ATCCTGCAAT 
ATGGACGACC CCAAGGCCCG TCTGGAAGAA ACCGTCAATG CCTATGACAA TTCCATCGTC 
GACCTGGATG CCTCCATTCA CCGCATGATT GCACTGTTGA AGAACAGGCC CGCCATTTAT 
TTTTACTGCT CCGACCACGG CGTAGCGCTG GGAGAGGAAG GAAAAATGTT CCAGGGCCAT 
ATCCTGCCGC CTGTTTACCG GCCTGCCATG TTCATCTGGT ATTCGGACAC CTTCGCCTCA 
CGCTATCCGG ACATGGTGCG CGCCCTGAAA GCCAACCGGC TGAAAGCCGT CTCCCACGAC 
CACATCTTCC ATACCCTTCT TTCCCTGGCT TCCATCCGGT CGGAAATCGT CAGGAACGAC 
CTGAATCTGG CTTCTCCGGA CGCGCGGGAA ACTCCGGCCC CCCTCCAGCC GGAAACGCTG 
GCGGAATGGC TGCCCATTCC CGCACCGCCG CAGCCGTAA

Protein sequence

MIPPHASAGS AERYPSAYGL SAAVCQALRA AFIPRRMRCL WAAGLAAALA ANPYVLNDGQ 
SLLMSSMGIA CSASLLCGTI LLCLKYRFTA YVLLPAIILF NAGLYMMQMR YGLVLNLSVL 
SSMAETNFQE ACAFCTPASI AGTLLLAGFI YLAIYWSRRS LRQKATWGAL ACIWGLYAAL 
LLLSIPAASY SLEPLYLYYT SDKAKGWPLV DIAMTCKLAD EYITQDAGRF NTLRNLPSCA 
EPLSQCEAPD DLAVVFHMGE SVRGDHLPLN GYHRNTMPRL SKEPNVVSFP HATSFGIVTR 
ISAIGMFTDA ELCRRTPGHS SFIDLFNKHG FRTVRIMDLS GDSIHDYSLG ILTRNCRERR 
QTPLQHQTPG MMQERTSLVM EESLKNFGRN RQLYIIYNNG SHMAFSYPAQ AECFTPASCN 
MDDPKARLEE TVNAYDNSIV DLDASIHRMI ALLKNRPAIY FYCSDHGVAL GEEGKMFQGH 
ILPPVYRPAM FIWYSDTFAS RYPDMVRALK ANRLKAVSHD HIFHTLLSLA SIRSEIVRND 
LNLASPDARE TPAPLQPETL AEWLPIPAPP QP