Gene Amuc_0442 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0442
Symbol
ID	6275614
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	524968
End bp	526080
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	59%
IMG OID	642612492
Product	glycosyl transferase group 1
Protein accession	YP_001877061
Protein GI	187734949
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.149003
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	81
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATAG TACATCTCGT CCCCTCCATG GAATCCGGAG GCGTGGAACA AGTCGTTATG 
GAACTGGGCA GCGGCCTTTC TTCCCGGGGC GTGGAAAATA TCGTCGTTTC CGGAGGCGGA 
CGCCTGGTGC CCCGTCTGGA AAAGGAAGGC TCCCGCCACA TCCTGATGCC GATAGGCAAA 
AAAAGCATCT CCACTCTCTT CCGCATCGGG GCCCTCCGCG CCCTGCTTCA GGCCGTCAGG 
CCGGATATCC TGCATCTCCA TTCCCGCGTT CCTGCGTGGG CAGGCTACCT GGCATGGAAA 
AAGCTCCCGC CGGAAGACCG CCCCGGCCTC GTCACCAGCG TTCACGGCTT CTACTCCGTC 
AACCGGTACT CCGCCATCAT GAGCCGAGGA GAGCGGGTGA TCGCCGTCTC CAACTGCATC 
AGGGACTACA TCCTTGACCA TTATCCGTCC ACCCCTCCGG ACCATATCAG AATCATACCC 
AATGCTATTT CCCCGGACCA ATATCACCCG GCCTACTCCC CCTCCCGGGA ATGGCTCACG 
GGCTGGTTCA TGTCCTATCC TGAACTGAAG GGGAAATTCA CCCTGTGCCT GCCGGGCCGC 
ATCACGCGCT TGAAAGGGCA TCTGGATCTG ATTCCGGTCG TCAGGCAGCT TCTGGAACAG 
GGAATCCCGG CCCACGCCGT CATTGTAGGA GAAGCAAAGA AGGGAAAAGA AGAATATAAA 
AACGAGGTCC TGCGGGCAAT AGAACGTTCC GGCGTCTCCC AGTCCTTCAC CTGGACAGGC 
CATCGCCAGG ATCTGAGGGA AATCCTTTCC ACATGTTCCG TCACCCTCTC CCTGACCAAA 
AGCCCGGAAG CCTTCGGCAA ATCAACCCTG GAGGCGCTCG CCCTGGGCAA ACCCGTAGCC 
GGATACGCCC ACGGCGGAGT CAAGGAACAG CTGGACGCCT TCCTTCCTGA AGGGAACGTC 
GCCGTAGGAG ATACCGCCGC CATGGCGAAC CTGCTGGCCC GCTGGCATAC CCAGCCCCCC 
CCCCTGCCCC GGCAAATTCC TTCCCCTTAC AATATGCAGG ATATGATTCA AGCCCATCTG 
GACGTTTACC AGGAACTGAC ACCTTATTCA TGA

Protein sequence

MKIVHLVPSM ESGGVEQVVM ELGSGLSSRG VENIVVSGGG RLVPRLEKEG SRHILMPIGK 
KSISTLFRIG ALRALLQAVR PDILHLHSRV PAWAGYLAWK KLPPEDRPGL VTSVHGFYSV 
NRYSAIMSRG ERVIAVSNCI RDYILDHYPS TPPDHIRIIP NAISPDQYHP AYSPSREWLT 
GWFMSYPELK GKFTLCLPGR ITRLKGHLDL IPVVRQLLEQ GIPAHAVIVG EAKKGKEEYK 
NEVLRAIERS GVSQSFTWTG HRQDLREILS TCSVTLSLTK SPEAFGKSTL EALALGKPVA 
GYAHGGVKEQ LDAFLPEGNV AVGDTAAMAN LLARWHTQPP PLPRQIPSPY NMQDMIQAHL 
DVYQELTPYS