Gene Amuc_2018 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_2018
Symbol
ID	6274502
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	2450608
End bp	2452089
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	58%
IMG OID	642614078
Product	Beta-N-acetylhexosaminidase
Protein accession	YP_001878609
Protein GI	187736497
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3525] N-acetyl-beta-hexosaminidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.191644
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.00584388
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCACGTC CCTTACCCAT TCTCGGCGGC ATTCTGCTAT CCTTCTCCCC TCCGGCAGAA 
GCAACAGCCC AATACAGCAT TATCCCTGAG CCGTCCAGAA CGGAACTCAG ACAGGAAACA 
GCTAAAACTT TACAGCTTCT TTCCGACCAG GAAGTTCCGA CCCTGGAAAC GGACGCCTAC 
CGGCTCACGG TCACCCCGCA GGGGGCGCAC CTTGCTTCCG GAGGAAGGGA AGGCAGAATT 
TACGGGCTGG CAACCCTCCG CCAGCTCCGG GACCAGCTGG CGGGACAGCC GGAGGGCATT 
CCCTGCGGCG TCATCACGGA CAAGCCGCGC TATCCGTGGC GCGGCCTCAT GGTGGATCCC 
GCGCGGCATT TCATCCCCGC GGCCGATCTG AAAAAATTTG TGGATATGAT GGCCTACTAC 
AAATTCAACA GGCTGCACCT GCATCTGACG GACAACCAGG GCTGGAGGCT GCCCGTGCCC 
GGCTACCCCA AATTGAAAAG CGTCGCATCC AGGCGGGAGG AAAGCTTCGG AGACGGAATC 
CCCCACGAAG GGATGTACAC CAAACAGGAA CTGAAGGAAC TGGTGGCGTA CTGCGCAGCG 
CGCGGCATTG ATGTCATCCC TGAAATAGAC ATGCCGGGCC ACAACCAGGC GCTTCATGCC 
GCCTACCCGG AATTTTTCTG CTTCCCCAAA CCGGACATGA ACGTGCGGAC GACAGCGGGA 
AACAGCAAGG AACTGGTCTG TCCCCAGAAG CCGGAAGTCT GGAAATTTTA TGCCTCCGTC 
TTTAATGAAC TCAAGGATAT CTTCCCGTCC GGTATCGTTC ATCTGGGCGG GGACGAGGCC 
CCCACGGAAC TCTGGGAAAA ATGCCCTCTG TGCCGGGAAG CCCGGACCAG GGCAGCCATG 
AAAGACGAAC AGGAACAGAT GAAAGCCTTT TTTGCGAAAA CGGCAGCTCT GCTTGCCAAA 
AACGGGCAAA CGCCGCAATT CTGGTATGAG GGGAACGCCG GCATTTACCA TCCGGGGGAA 
ACGGTTTACG CATGGCGGCA AGGCCAGGCC CTCCAGTCCA TTGAGAAGAC GAAAAAGGCG 
GGATTGAACC TGATTATGGC CTCCAGCGAA TACTGTTACC TGGATTTTCC CCAGATTCAG 
GGGCAGCGCA ACTGGGGATG GATGAAAACC ACCACCCTGC AAAAATGTTA TGACCTGGAT 
CCCGCTTTTG GAAAACCGGA GAAAGAGGCA GGCCATATCC GGGGCGTGCA TGCCCCCGTA 
TGGGCGGAAC GCCTGCCGGA CTTGAACCAC TTGCTTTACC GCGCCTATCC CCGCGCCTGC 
GCCATTGCGG AAGCCGGCTG GTCACCGATG GGCGTGCGCT CCTGGGAAAA CTTCCGGCGC 
AAGCTGGCCG ACCACCGTCA ATTCATCCTC AAACGCTTCA ATTATGATAT GGAGCGCACT 
CAGGGGAATG AACCGGCCTT CCGCTGGGAA AACAACAAGT AA

Protein sequence

MARPLPILGG ILLSFSPPAE ATAQYSIIPE PSRTELRQET AKTLQLLSDQ EVPTLETDAY 
RLTVTPQGAH LASGGREGRI YGLATLRQLR DQLAGQPEGI PCGVITDKPR YPWRGLMVDP 
ARHFIPAADL KKFVDMMAYY KFNRLHLHLT DNQGWRLPVP GYPKLKSVAS RREESFGDGI 
PHEGMYTKQE LKELVAYCAA RGIDVIPEID MPGHNQALHA AYPEFFCFPK PDMNVRTTAG 
NSKELVCPQK PEVWKFYASV FNELKDIFPS GIVHLGGDEA PTELWEKCPL CREARTRAAM 
KDEQEQMKAF FAKTAALLAK NGQTPQFWYE GNAGIYHPGE TVYAWRQGQA LQSIEKTKKA 
GLNLIMASSE YCYLDFPQIQ GQRNWGWMKT TTLQKCYDLD PAFGKPEKEA GHIRGVHAPV 
WAERLPDLNH LLYRAYPRAC AIAEAGWSPM GVRSWENFRR KLADHRQFIL KRFNYDMERT 
QGNEPAFRWE NNK