Gene Amuc_1869 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1869
Symbol
ID	6275706
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	2271629
End bp	2272927
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	55%
IMG OID	642613930
Product	glycosyl transferase group 1
Protein accession	YP_001878464
Protein GI	187736352
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	0.740215
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACAA TTCGAGTTCT TACATTAGGA TGGGAATTCC CGCCCCTGGT CAACGGGGGG 
TTGGGCATTG CCTGCCTGGG TCTTTCCAAG GCGCTGGCAA AAAAAGTGGA TTTAAGGGTG 
ATCGTTCCCA AGGCCGACCC TTCCGTCCTT TTTGACGGAT TCCAGCTCAC CGGTCTCAAT 
AACGTCTCCT ATCGGGAAGT GGAGCAAGTG GACCGGAAAT ATTCCTATGA CAGCTTTGCC 
CTGGTGGAGC GCGCGCCCAT TGAACTGGAC CCCTACACCA CCGTGGAAGG GGGATCCGGC 
GTGGTGCAGT TCACCAAGGA AGGCCGCATC ACCTTCTCCA AAACGCATGA AGCCGACCTT 
CAGCTGTTCA GGAACAAGGA AGACCTTTAC GCCGGAGACC TGGCCCTGAA AGTCATTCAA 
TTCTCAAAAA TAGCGGTAAA AGTCGCCCTT CAGCAGGATT TTGACATTAT CCACGCCCAT 
GACTGGATGA CCTATCTGGC TGGCGTGGAA GTGAAAAAAG CCACGGGCAA GCCCCTGGTG 
GTGCATCTGC ACGCTTCCCA GTTTGACCGT GCCGGAGCGG ATGCCCGCGG CTGGATTTAC 
GACATTGAAA AATTCGGCAT GGAACAGGCG GATGCCGTTA TCCCGGTCAG TAAATACACG 
GGAACCATCG CCAGCGGGCA CTATGCCATC GACCCCCATA AGATATTTCC CATTCACAAC 
GGAGCGGATC CGGTCAAAGT CTTCAAAGGG AAGAAAAAAT TCCCGGAAAA ACTCGTCCTC 
TTCCTGGGCC GCCTGACGGC TCAGAAAGGC CCGGGATTCT TCCTTCAGAT TGCCGCCAAG 
GTTCTGGAAC AGACGGACGA CGTACGCTTC GTCATGGCCG GTACGGGAGA AAAGCTCCGC 
CAGTTGATCG AATCCGGAGC CTTCAAGGGC GTGGGCGACA AATTCCACTT CACCGGCTTC 
CTGAACAAGG ACAAAGTCAA TGAACTCCTC TCCATCACGG ACATCTACTG CATGCCTTCC 
GTATCGGAGC CCTTCGGCCT TTCTGCGCTG GAGGCGGCCC AATTCAACAT TCCCGCCGTG 
ATTTCCAAGC AGTCCGGCGT GGCGGAAGTC ATGAAGGGAG CCCTGAAAGC GGATTTCTGG 
GACGTCAACA AGATGGCGGA ACATATCGTC CATCTCTGCA CGGATGAGGA ATTGTACCGG 
AAAGTAGTGG AACAGAGCAC GGAGGACATC AAGGCCTCCA CCTGGGATGC CGCCGCAGAC 
AAGGTTATCC GGGTCTATGA ACATGTGCTG AACCGCTAA

Protein sequence

MSTIRVLTLG WEFPPLVNGG LGIACLGLSK ALAKKVDLRV IVPKADPSVL FDGFQLTGLN 
NVSYREVEQV DRKYSYDSFA LVERAPIELD PYTTVEGGSG VVQFTKEGRI TFSKTHEADL 
QLFRNKEDLY AGDLALKVIQ FSKIAVKVAL QQDFDIIHAH DWMTYLAGVE VKKATGKPLV 
VHLHASQFDR AGADARGWIY DIEKFGMEQA DAVIPVSKYT GTIASGHYAI DPHKIFPIHN 
GADPVKVFKG KKKFPEKLVL FLGRLTAQKG PGFFLQIAAK VLEQTDDVRF VMAGTGEKLR 
QLIESGAFKG VGDKFHFTGF LNKDKVNELL SITDIYCMPS VSEPFGLSAL EAAQFNIPAV 
ISKQSGVAEV MKGALKADFW DVNKMAEHIV HLCTDEELYR KVVEQSTEDI KASTWDAAAD 
KVIRVYEHVL NR