Gene Amuc_2094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_2094
Symbol
ID	6275650
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	2545392
End bp	2546396
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	60%
IMG OID	642614156
Product	glycosyl transferase family 2
Protein accession	YP_001878684
Protein GI	187736572
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCCGC TTTTTTCCAT CATCATCCCC GTTTACCGTT CCGGCCCTTT CCTCAGGGAC 
TGCCTGGACT CCATCAGGAA CCAGACCCTG ACGGACTGGG AATGCATCTG CATCAATGAC 
GGCTCCCCGG ACGACAGCGG AGCCATCCTG GACGAATACG CCCGGAAGGA CGCCCGTTTC 
ACCGCCATCC ACCAGGACAA CCGGGGCGTA AGCGCCGCGC GCAATGCGGG GCTTTCCCTG 
GCGAAGGGAA ACTGGACCGC CTTTGTGGAC GGGGACGATA CCGTGGAGCC GGACATGCTG 
GCCTGCCTCC ATGAGGAAGC TCTCCGCGCG CAGGCAGCCG CCCTCCTCTG CTACGGAATC 
AGCAAAGACT TCCATGCGGG TTCCCGGCTC ATCCGCACGG AAACCACCCT CCCAAGCCGG 
AACCAGCACA TCCCCGCGGG GGAAACGGGG GCTTTCCTGC GCTACCTGCT GACCAGCCTG 
GACATGGAAT CCTCCTGCAA CAAATTGTTC CGCACGGAAC TCCTGAAAAA AAACGGCATC 
CTCTTCAACA CCTCCGCCGT CGTATTTGAA GACTTCCAGT TTGTCCTGGA CTACCTTTCC 
GTCTGCGCCC CGGACATCAT CCTGCTCAAA AAAGCCTTCT ACCATTACCG CGCGCAGGAA 
ACGGAAAACG GAGCGGCCAA GCGCAGCCGC TTCAATCTCG TCCGGGACAT AGACACGCTC 
ACAACCAAAT TCCTGGCCTG GACCAGCACC CTTTCCCTCC CGCAGGAAGA TATTCCCATT 
GTCAAAGGCT ACATCCTGCA AAAAATCAGC GTGATTTTCC ATGCCCTCCA GCGGCAGCCC 
TATGCCGCGC GCAAGGAAGT ATTCCGGGAC TTCCTTACCA GCGGACTGGC CGCACGCAAG 
GCGGAGCTTC CCCTGTGCGG CCGCTACTTC CACCTTGTCT GCCGTCTGCT GGCGGCACGC 
AGGTACCGGC TGGCCCACCT TCTGCTGAAG GCAAGGAACA TCTGA

Protein sequence

MSPLFSIIIP VYRSGPFLRD CLDSIRNQTL TDWECICIND GSPDDSGAIL DEYARKDARF 
TAIHQDNRGV SAARNAGLSL AKGNWTAFVD GDDTVEPDML ACLHEEALRA QAAALLCYGI 
SKDFHAGSRL IRTETTLPSR NQHIPAGETG AFLRYLLTSL DMESSCNKLF RTELLKKNGI 
LFNTSAVVFE DFQFVLDYLS VCAPDIILLK KAFYHYRAQE TENGAAKRSR FNLVRDIDTL 
TTKFLAWTST LSLPQEDIPI VKGYILQKIS VIFHALQRQP YAARKEVFRD FLTSGLAARK 
AELPLCGRYF HLVCRLLAAR RYRLAHLLLK ARNI