Gene Amuc_1803 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1803
Symbol
ID	6274433
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	2190573
End bp	2191709
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	58%
IMG OID	642613867
Product	metallophosphoesterase
Protein accession	YP_001878402
Protein GI	187736290
COG category	[R] General function prediction only
COG ID	[COG1408] Predicted phosphohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.499109
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.0107634
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCTGA TTTTCGGAGC ATTGCTGGCG GTTTACGTTT TTTGCCGCGC TATTTTGCCG 
CTGAAGCTGA AATGGGGCTG GAAGCTTCTG CTTGCCGCCC TGCTGGCGGT GGCGGCATTC 
AAATTCCACT TGCTGCATTT GTTTGGAGGC CCCATGTTTT TCTCCCCGGT TTTGCCGGAA 
AACGTTCTGC TGGCGGCCGC GTGGCTGTTC TCCGTTCTTT TCCTGTTCTT TTTCCTGCTG 
CTGGCGGCAG ATGTGGTGCG GGCTCTGTAT CTGCTGGTTT TGTTCTGCTT GCGGAGGAAC 
AGGACGGAAA GGTTCCGCAT CATTGGCAAC CGGGTGAATG TTGCTTTGCT GGTTTTTTCC 
GCCGTGCTGG CAACTGTGGG CATGATTGGA GGCACCAGAG TGCCCCAGGT GAAGGAGGAA 
ACGGTTGCCG TGAACCGCCT GCCGGAGGAG GCGGACGGAT TGACGGTCGC CGTGCTGGCG 
GATCTGCATG TGGACGGCAT TACAAGGGAG GAGCGCATTC GGAAGATTGT GGAGCGCACG 
AACGCCCTGA ATCCGGACAT CGTCGTGATT GCCGGAGATT TCGTGGACGG GACGGTGCCC 
GTGCATGGCG GCGATTTGAG GCCGCTTGCG GATTTGAAGG CCAGATACGG GGTGTTCGGC 
GTGCCGGGCA ATCATGAGTA TTACTCCGGT TATGAGGAGT GGATGGAGTT CCTGCCCAAT 
CTGGGCATTC GTATGCTTCT TAATGAACAC GCGCCGGTGG GAGGGGAGGC CGTGGTATTG 
GCCGGTGTGA CGGATCCTGT GGCCGGCATC ATGGGGAAGG AGGAGCCGGA TATAAGCAAG 
GCGTTGAAGG ATGCCCCGGA AAAGGGAGTG CGCATCCTTG TTTCCCACCA GCCGCAGCTG 
GCCCGGGAAG CGGCTGCGCA CGGCGTGGAT CTTCAAGTGT CCGGCCATAC GCACGGAGGC 
ATGATTGCCG GCGTGGACCG GCTGGTGGCG CGTTTTAACG AGGGATTCGT CTCCGGGCTG 
TACACGGTGG GTAATATGAA GCTGTACGTT TCCAATGGGG CGGGGATTTG GAACGGCTTT 
CCCATCCGCA TCGGCGTTCC ATCGGAAATT GTTCTGATTC GGCTTCGGAA AGAATAA

Protein sequence

MILIFGALLA VYVFCRAILP LKLKWGWKLL LAALLAVAAF KFHLLHLFGG PMFFSPVLPE 
NVLLAAAWLF SVLFLFFFLL LAADVVRALY LLVLFCLRRN RTERFRIIGN RVNVALLVFS 
AVLATVGMIG GTRVPQVKEE TVAVNRLPEE ADGLTVAVLA DLHVDGITRE ERIRKIVERT 
NALNPDIVVI AGDFVDGTVP VHGGDLRPLA DLKARYGVFG VPGNHEYYSG YEEWMEFLPN 
LGIRMLLNEH APVGGEAVVL AGVTDPVAGI MGKEEPDISK ALKDAPEKGV RILVSHQPQL 
AREAAAHGVD LQVSGHTHGG MIAGVDRLVA RFNEGFVSGL YTVGNMKLYV SNGAGIWNGF 
PIRIGVPSEI VLIRLRKE