Gene Amuc_0937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0937
Symbol
ID	6274228
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	1114739
End bp	1116295
Gene Length	1557 bp
Protein Length	518 aa
Translation table	11
GC content	61%
IMG OID	642612991
Product	metal dependent phosphohydrolase
Protein accession	YP_001877550
Protein GI	187735438
COG category	[F] Nucleotide transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0248] Exopolyphosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	68
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCAAG GCGAGCAGGT TCAGGATTCG GAATTATCAA CTCAGGCGGT GATCTATCTG 
GGCCCGAGCT CCATGAGCCT GATGGTGGCT GAGGCTGTCC GGGACAGGAT TCGCCTGCTG 
GATTTCCTTC AGCAGCCCGT TCCGATGGCG CGTGACATTT TCCGGTTCCA CCGCATTTCC 
CGGCATACCA TGGACCGCTG CGTGCAAATC ATCGGCGACT ATCTGGAAAT TCTCAAGGAA 
TACGGAGCCG GCAGCAAGCT TTCCGTCCGG TTCATGATTT CCAACATCAT TTCCGAGGCG 
GATAATGTGG ACGTGTTCGT GAACCGCATG CACGTGGCCC ACGGCTTGCG GGGGCGCCGC 
ATTGACGACG GCAAGATGAC GCGCCTCATT TACGTGAAGG TGCAGGAGGC TCTGGCCCAG 
TATCCGGGAT TCAGCAAGAA AAAGGTGCTT GTGGTCCATA CGGGGCCGGG CAATACCCGC 
GTGCTTCTGT TCCAGAAGGG GCGCATCGTG CGTTATTCCT GCTACAGGCT GGGAACGCAC 
CGCACGGGGG AGGCCGTCGG GGAAATTGAG TACGGAGACG ATGTGGCGGA GCTTTCCATT 
CTGCGGGAGC ACATGCGCGG GCAGGTGGAC CAGATTTGCC TGGATTACGG GGGCGTGAAG 
GGCCTGGCGG GCCTTATCGT CATCGGCCAG GAAATGCAGC AGCTCCGGGA CCGCCTGGCC 
CCCACGCCGG AAGGCAAGGT GGCGTGTTCC TCCCTGGCGG CGGAGGCGGA GCGGATGTCC 
CGCACCACTC TGGAACAGCG CATGAATGTT TACGGTGCGG ATTTTGCCGG GGTGGACTCC 
CTGCTGCCCG CCGTTTTGAT GACGGAAATG ATTGCCCGCA GCCTGAACCT GGATGACGTC 
ATCATTCCCG CGAGCGGTTA TGACGAGGAG TTTTCAAGCA GCCTGATACG TGCGGAACAG 
CATCCGGGGG ATCTGGAGGC GGAGGTTCTC CATTTCGCCG GGATTCTGGC GGACAGGTAC 
AAGGCGGACA AAGGGCACCG CGAGCATGTG GCGCGCCTGT GCATGGAAAT GTTTGACCAG 
CTTCAGGACC TGCACCGCCT TTCCGAACAT GACCGGCTGC TGCTGGAAGT GGCCTCCATT 
CTGCATGAGG TTGGGTCTTT TATCAACCAG CAGAATCACC AGCTCCATTC CCAGTATATC 
ATTCTCAACA GTGAAATCTT CGGCCTTTCC CGGGATGATG TGGAAACGAT CGCCCTGCTG 
GCCCGCTACC ACCGGCATGA GGTTCCCGCC AATTCCGATC CCATGTACGG GGAGCTGGAA 
TTGAGGGACC GCATGCGCGT AGCCAAGATG GCCGCCATCC TGCGCGTGGC GGATGCCCTG 
GAACGCGGCC ATGCCCAGCG CGTGAACGGC GTCCGGGCGC ACATCCGCGG GCGCATGCTG 
GAGCTGGAGC TTCAGGGCGT GCGTGAAACC GCCGTGGAAG ACCTGGCCCT GCGGCTGAAG 
GGCGACCTGT TTGCGGATAT CTTCGGTTAT GACGTCGTGC TGGCGCCCCA GCGGTAG

Protein sequence

MIQGEQVQDS ELSTQAVIYL GPSSMSLMVA EAVRDRIRLL DFLQQPVPMA RDIFRFHRIS 
RHTMDRCVQI IGDYLEILKE YGAGSKLSVR FMISNIISEA DNVDVFVNRM HVAHGLRGRR 
IDDGKMTRLI YVKVQEALAQ YPGFSKKKVL VVHTGPGNTR VLLFQKGRIV RYSCYRLGTH 
RTGEAVGEIE YGDDVAELSI LREHMRGQVD QICLDYGGVK GLAGLIVIGQ EMQQLRDRLA 
PTPEGKVACS SLAAEAERMS RTTLEQRMNV YGADFAGVDS LLPAVLMTEM IARSLNLDDV 
IIPASGYDEE FSSSLIRAEQ HPGDLEAEVL HFAGILADRY KADKGHREHV ARLCMEMFDQ 
LQDLHRLSEH DRLLLEVASI LHEVGSFINQ QNHQLHSQYI ILNSEIFGLS RDDVETIALL 
ARYHRHEVPA NSDPMYGELE LRDRMRVAKM AAILRVADAL ERGHAQRVNG VRAHIRGRML 
ELELQGVRET AVEDLALRLK GDLFADIFGY DVVLAPQR