Gene Amuc_0868 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0868
Symbol
ID	6274300
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	1036915
End bp	1038564
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	58%
IMG OID	642612923
Product	Beta-N-acetylhexosaminidase
Protein accession	YP_001877482
Protein GI	187735370
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3525] N-acetyl-beta-hexosaminidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	72
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTTCCA AGTGTACCTT TTCCGCCACG GTTTTCAGCC TGTTTTCCCT TTGCTGGGGC 
GCCCCATCCT CTCCGGTTCT CGAAGCGCCC CATACCATTC CCCTGCCCGC CGCCATGCGC 
GTCCAAACCG GAGAAAGCGG GTTTTCCCTG AAAAACGGCG TCAGGCTCCC GGAAAAAAAT 
CCTCTTTCCA GGCAGGCGGA ACGGATTTTC CGCGACAACG GGATCAACAC GGCCCTGGTT 
AAAAACAACG CGGACATCAT CTTTACGGAA GACGCTTCCC TGGGCAGGGA AGGCTACCGC 
CTTGCCGTAA CGCCGGATTC CATCTCCATT GCCTCCGGTT CCGTGAACGG AACCCTGTAT 
GCCCTTCAAT CCCTCGTTCA AAGCATCGCT GCCGACAAAA ACGGAGCTCC GGCCCTGCCC 
CGGATGGACG TAAAAGACCA GCCCCGCTTT TCATGGCGGG GCCTGATGGT AGACAGCTGC 
CGCCACATGA TGCCCGTGCG GGACATCAAA AAAGTGCTGG ACCTGATGGA ACGGTATAAA 
TTCAACACCC TGCACTGGCA CCTGACGGAC GACCAGGGGT GGCGTCTCCC AATCGCCAAG 
TACCCCAGGC TGACAACCGT GGGAGGCGCC CGGGCTCAAT CCCCCGTCAT CGGCAACCGC 
AATAAGGGAG ACGGCATCCC CTACTCCGGC CATTACACCG CAGATGAAAT CCGGGATGTG 
GTGCGGTACG CCAGAGACCG GGGCATTACC GTCATTCCGG AAGTGGAAAT GCCAGGCCAT 
GCCTCCGCAG CCATCGCCGC CTATCCGGAA CTGGGGAATA CGGACATCCC GGGTTATGAG 
CCTAGGGTGC AGGAAACCTG GGGCGTGCAC TCCTATACCT TCTCCCCCAC GGAAAAAACC 
TTCCGTTTTC TGGAAGACGT CATTGATGAA ATATGCGCCC TGTTCCCGGA CAGCCCCTAC 
ATCCACATCG GAGGGGATGA AGCGCCCAAG AATCAGTGGA AACAGTCCCC CACGGCCCAG 
CGGGTCATGA AGGACAACGG CCTGGCCAAT GAACACGAGC TCCAGAGCTA CTTCATCCGC 
CGCGTGGAAA AAATGATCAA TAACCGCGGA AAAAGGCTCA TTGGCTGGGA TGAAATCCAG 
GAAGGGGGCC TTTCCCCCAC CGCTACCATG ATGGTTTGGC GCAGCCAAAT GCCGCACATC 
GCCGCACAAG CCCTGGCTCA AGGCAACGAT ATTGTGATGA CGCCCAACAG CCACCTGTAC 
TTTGACTATG ACCAGGGGCC CGGAAAACCC GCTGCCCCCG AATACGAGAC GATTAATAAC 
AATCAGCTGA CCTGGCAGCA TGTTTACGGA CTGGAACCGG TGCCTCAGGG AACGCCCCGG 
GAACGGGAAA AGCAGGTGCT GGGCTGCCAG GCGAACATCT GGACGGAATA TATCCCGAAC 
CTGCCGAAAT GGGAATACCA TGTCTTCCCC CGCGCCCTGG CGCTGGCGGA AGTTGCCTGG 
ACCCCGCAGG AGCTAAAAAA TGAGAAAGAT TTCCGTAAAC GCCTCGACCG CCAGCTTCCC 
TTCCTGGACG CCCGCGGCGT CAATTACAAA AGACCGGACA ATGGAGCCCC CGCACAGCCG 
AAGGCCGTCA TTACGCGGGA ACGCCGTTAA

Protein sequence

MISKCTFSAT VFSLFSLCWG APSSPVLEAP HTIPLPAAMR VQTGESGFSL KNGVRLPEKN 
PLSRQAERIF RDNGINTALV KNNADIIFTE DASLGREGYR LAVTPDSISI ASGSVNGTLY 
ALQSLVQSIA ADKNGAPALP RMDVKDQPRF SWRGLMVDSC RHMMPVRDIK KVLDLMERYK 
FNTLHWHLTD DQGWRLPIAK YPRLTTVGGA RAQSPVIGNR NKGDGIPYSG HYTADEIRDV 
VRYARDRGIT VIPEVEMPGH ASAAIAAYPE LGNTDIPGYE PRVQETWGVH SYTFSPTEKT 
FRFLEDVIDE ICALFPDSPY IHIGGDEAPK NQWKQSPTAQ RVMKDNGLAN EHELQSYFIR 
RVEKMINNRG KRLIGWDEIQ EGGLSPTATM MVWRSQMPHI AAQALAQGND IVMTPNSHLY 
FDYDQGPGKP AAPEYETINN NQLTWQHVYG LEPVPQGTPR EREKQVLGCQ ANIWTEYIPN 
LPKWEYHVFP RALALAEVAW TPQELKNEKD FRKRLDRQLP FLDARGVNYK RPDNGAPAQP 
KAVITRERR