Gene Amuc_2088 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_2088
Symbol
ID	6275819
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	2538989
End bp	2540032
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	57%
IMG OID	642614150
Product	glycosyl transferase group 1
Protein accession	YP_001878678
Protein GI	187736566
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAAGC AATATGACTT CATCTACCTG ACCAATACGC CTTCCTTTTA CAAAGTAAGG 
CTTTGTGAGG AACTGGCGAA AAAACACTCC GTTCTCCTGG TTCTTTACGG CTATGGGGCG 
GAAGCGGTCA ATACCCAGCT CTCCGGCAAT GAGGGAGGCT TTGACTACTT CTTTCTGCAT 
GAGGGAGATG CGGGAAAAAG AAACAAGGCT CTTGTCCTGC TCAGGCTCCT GAAGCTGATG 
GCCCGGGTTC GGGCCCGCAG AGTGCTGTTC TCCGGCTGGA TGGCGCCGGA ATACAACATA 
TACAGCTTTT TTTCCCCCAG GCGCCGCAAT GCCGTCATTT GCGAATCGTC AGCCATTGAT 
TCCGGCATGA GCGGCTGGAA AAGCCTGCTT AAAAAAGCCG TCATACGCCG CATGAGCGCG 
GCGCTGCCTT CCGGTTCCCC CCACCGCGCC CTGTTTGAGC ATATTCGTTA TCCGGGAGAC 
ATCCATGTCA CGGGCAGCGT AGGCATCTTT AACATGGAAG GCCGCCGTGC CCTCCGCCAT 
TCCCCGTCCG CTCCCCTGAA CTACATTTAC GTCGGGCGTC TCGCGCCGGA AAAGAATCTG 
GAACTGCTCA TCAGGGAATT CAACTCCAAT GGGCGGCCTC TGTCCATCGT GGGGGACGGC 
CCTCAAAAAG AACTTCTCAA AAACATGGCC AAGGATAATA TCCGCTTTCT GGGCCACGTT 
CCCAACGACA GACTCCCGGA AATATACGGA CGGCATGACG TGTTCATCCT CCCCTCCCGC 
TATGAGCCGT GGGGGCTGGT CGTGGAAGAG GCCCTCTTCC GGGGGCTGCC CGTCATCGCC 
AGCGACAAGG TGGGCAGCGC GGCCGACATG GTTGCCGCTC TGGAAACGGG CGCCGTCTTT 
TCCCTGTCCG CGCCGGACGG CCTGAGCAAC GCCATTCATG AAGTTGAAAA GAATTATGAA 
ACCATGGCGC GCCGCGTCGC GGACATCAAC TGGAACAGCC GCGTGGAAAC GCAGCTCAAG 
GCATACACCT CCCTTTTAGA TTAA

Protein sequence

MNKQYDFIYL TNTPSFYKVR LCEELAKKHS VLLVLYGYGA EAVNTQLSGN EGGFDYFFLH 
EGDAGKRNKA LVLLRLLKLM ARVRARRVLF SGWMAPEYNI YSFFSPRRRN AVICESSAID 
SGMSGWKSLL KKAVIRRMSA ALPSGSPHRA LFEHIRYPGD IHVTGSVGIF NMEGRRALRH 
SPSAPLNYIY VGRLAPEKNL ELLIREFNSN GRPLSIVGDG PQKELLKNMA KDNIRFLGHV 
PNDRLPEIYG RHDVFILPSR YEPWGLVVEE ALFRGLPVIA SDKVGSAADM VAALETGAVF 
SLSAPDGLSN AIHEVEKNYE TMARRVADIN WNSRVETQLK AYTSLLD