Gene Amuc_0847 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0847
Symbol
ID	6274322
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	1009272
End bp	1010336
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	60%
IMG OID	642612902
Product	metal dependent phosphohydrolase
Protein accession	YP_001877461
Protein GI	187735349
COG category	[R] General function prediction only
COG ID	[COG3481] Predicted HD-superfamily hydrolase
TIGRFAM ID	[TIGR00277] uncharacterized domain HDIG

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.241634
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	84
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACGCA TGGAACAAGT CAGTCTCATG GAGTTGGGCA AGCTGGCCGC GGAAGGCCAG 
CTTGAAGCGG AAGTTTTTGC CCAGATTGCC CAGTGCGCGC AGAAGATGAC CAAGGGCAAC 
AAGCCGTATC TGGATGTGTC TTTTGCCGAT GCGGAAGGGA CAATGGGACT GAAGGTGTGG 
GAGGATAAAC CCTGGTTCCG GACGCTCGCT TCCCTGCCCC TCCGCAGTTT CGTGAGCCTG 
CGCGGCCAAT GGGCCAAGGG AGGGTTCGGC ATGGAAGTTT CCGATCTGGA CGTGCGGTTG 
CTGGACGAAC GGGAAAAGGA AAGCTTTCTG GCCGGTTCCG GAACCTTGAA GAAAAAGCAG 
GAAGCTGATC TGAAGGAAAT TTGCGTACTC ATCAAGGGCA TGAATGATCC GCGCATACGC 
GCCCTGTGCA TTGAATTCAT TGAGCAGTTC GGGGAACGCC TCCAGCGCGC CGCCGCCGCC 
CGCACCTACC ATCACGCCCG CCGTGGCGGA CTGGTGGAGC ACGTAGCGGG GATGATGCGC 
ACGGCCTCTG CCGTCTGCCA GGCAAATCCG GGCCTGAACC GTGATCTTCT GCTGGCCGGG 
TGTCTGTTTC ACGACTGCGG GAAGTTGTGG GAAAATTGCT ACCCGAAGGA GGATTTTACG 
ATGCCCTATT CGGAGGCCGG AGAACTGCTG GGCCATATTC CGCTGGGCAT TGAACTGGTC 
AACAATTTGT GGAAGCGCAT CATGTCCCTT CCGGAAGCGG ATTCCTGGAA GACGCTGGAC 
CCTCCTTCCC CGGACGTGCG CATGCACCTG CTGCACCTGA TTGCGTCCCA CCACGGGGAA 
CTTGCCTTCG GCTCCCCCGT GTTTCCCAAA ACGCCGGAAG CGGTGGCCCT GCATTACATC 
GACAATCTGG ACGCCAAGCT GGAAATGTTC CGCGGAGCTT ATGAGACAAG CGAGGCCCTG 
GCTCCCAGAG TGCTCCAGCG CAAGGCCCCC CTGCCTGCCA ACGTTGTTCT TCCGCTGCCT 
TCCGTCCTCC CGCTGGAGCC GGATGGTGCG GATGCCATGC CGTAA

Protein sequence

MARMEQVSLM ELGKLAAEGQ LEAEVFAQIA QCAQKMTKGN KPYLDVSFAD AEGTMGLKVW 
EDKPWFRTLA SLPLRSFVSL RGQWAKGGFG MEVSDLDVRL LDEREKESFL AGSGTLKKKQ 
EADLKEICVL IKGMNDPRIR ALCIEFIEQF GERLQRAAAA RTYHHARRGG LVEHVAGMMR 
TASAVCQANP GLNRDLLLAG CLFHDCGKLW ENCYPKEDFT MPYSEAGELL GHIPLGIELV 
NNLWKRIMSL PEADSWKTLD PPSPDVRMHL LHLIASHHGE LAFGSPVFPK TPEAVALHYI 
DNLDAKLEMF RGAYETSEAL APRVLQRKAP LPANVVLPLP SVLPLEPDGA DAMP