Gene Amuc_2108 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_2108
Symbol
ID	6274499
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	2568207
End bp	2569166
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	53%
IMG OID	642614170
Product	glycoside hydrolase family 16
Protein accession	YP_001878698
Protein GI	187736586
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2273] Beta-glucanase/Beta-glucan synthetase
TIGRFAM ID	[TIGR02595] PEP-CTERM putative exosortase interaction domain

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	0.369089
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCATCA GGACAACGCT CCTTTTTCCT ATTCTTTTTC TCTCACTTTC AGGATCCTCC 
GTCATGGCGG CAACCCCTTG GGTTTCTGAC AGGAACTGGG AACTCGTTTT TGAAGACAAT 
TTTGACGGCT CATCGCTGAA CGCACACAAC TGGAGCCGCA TTGATTACGT AGGCTATAAT 
GCCCCGGACT GGCGCAAGTA CCAATCCCGG GACGAAAGCC TTGTGGAATT CCGGGAAAAG 
GACGGCAACT CCGCCATGAC CCTGTGGGGA AAATACGGGG ACTACACCAC CCAAACCAAC 
CAGACTGCCC CAGCCAGGAC ATACGCCTGC GGAGGGGTAT ATTCCCTGAA AACCTTCTCC 
TTCCAATATG GATACGTAGA AGTCCGCGCC AGATTCGACT GTGTGCAGGG CGTCTGGCCG 
GCCATCTGGA TGATGCCCAA ATCCGACAGC ATCGGCTGGC CTGTCGGAGG GGAAATTGAC 
ATCATGGAAC ACCTGAATTA CGAAGGCCGT GTTTACCAGA CAATCCACTG GTCGCAAAAC 
GGCGTTCCCA ACCAGGATAA CTCCCAGGGG GTCACCCCCG GTTGGAACGA TGGTGCCGAA 
AAAGCAAACT GGCATACCTA CGGGATGGAA TGGACGGAAG AAGGCATCAC CTTTTATGTG 
GATGGAAAAG CAACCGGTTC ATTCAAAAAG CCCAATAACG CAAACTGGCC CTTTGACAAG 
GACGGAAACG AATTCTACCT GATCATCGAC CAGCAGATTG GAGGCAGCTG GGTGGAAAAC 
GCAGGAGTTA ATAAGGGAAT CGACCAAAAT ACGCTGGCCA ATTCCGGAGC CGCATTCGAC 
ATCGATTATG TCAAAGTCTA TTCCTCAAGC ATCTACAACC ACCTCGTTCC GGAACCCGCT 
GTGGCTTCGC TGGGCCTGTT GGGAATGGCC TTGCTGGCGG CTCGCCGCAA AAGAAACTGA

Protein sequence

MFIRTTLLFP ILFLSLSGSS VMAATPWVSD RNWELVFEDN FDGSSLNAHN WSRIDYVGYN 
APDWRKYQSR DESLVEFREK DGNSAMTLWG KYGDYTTQTN QTAPARTYAC GGVYSLKTFS 
FQYGYVEVRA RFDCVQGVWP AIWMMPKSDS IGWPVGGEID IMEHLNYEGR VYQTIHWSQN 
GVPNQDNSQG VTPGWNDGAE KANWHTYGME WTEEGITFYV DGKATGSFKK PNNANWPFDK 
DGNEFYLIID QQIGGSWVEN AGVNKGIDQN TLANSGAAFD IDYVKVYSSS IYNHLVPEPA 
VASLGLLGMA LLAARRKRN