Gene Amuc_2084 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_2084
Symbol
ID	6273990
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	2534852
End bp	2536024
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	52%
IMG OID	642614146
Product	glycosyl transferase group 1
Protein accession	YP_001878674
Protein GI	187736562
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	0.573542
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATTT GTTTTGTCGC ATGGTCTGAT TTCGGAATAG GAGGCGTCCC AAGAGTTCTG 
ACCTGCCTGA TGGATGCCTT GTCACGCAAA CATGACGTAA GCCTCTACTC CCTGAAAAAC 
CTTCCGCCGT CAGGCATCCA AGGAATCAAC CGGGAACAAA TTCATATTTA CTGCAGGGAA 
ATGAATTTAT ATGAGAAAAT TCGCCGCTCC GCGGCGGACA TTCTCGTCTG CAAAACCCCT 
CTGTTCAGCT CCGCCCTTGG CTGCCGGCTA TACGCGGCCG CGCGCTACAC GTCAGGCTTC 
AAAAAGGCGC TGACGAACCA TCTCAATAAA CATCAATATG ATGTGGTCAT TTTCGGTTCC 
GGCTTTGAAG ACTCCCTGCT TCTCGCCCTC ACCAAAAACA AGCTCCTGCC CAGCATGAGA 
ATACTGACGT GGTCCCATGC TTCCTATGAC AACTATTTCA CCAACATGGG TTCCTTCTTC 
TCCCGGTACA TGAAGGAAGC CATCAAGGCA TATTACCATC GTTTCGATGA AATCATCGTC 
CTGTCTGACG GGGACGAAAA AGAATTCAGA GAAAAACACC ATCTCCCCGC CCGTCGAATC 
TACAACCCCA ACACGATGAA CCCGGCCAGA AAATCGACCC TTACCAGCAA AACGTTCGTT 
TACGTCGGGG CTCTCTCCCA CCAGAAAGGG ACTGATCTGG CCGTCCGCGC GTTCCACAAA 
TTCATTGAAA CGGATCAGGA ATGGAATCTC CACATCTATG GGGAAGGCCC GCTGAAAGGA 
TGGATTGAAG AATATGTATC CTCCAACGGT TTGCACCACA GAATCATTCT GCACGGGCCC 
TGCGGAAATA TGGAGGAAGA ATTTCCCCGC CATTCCATCC TGCTCTTTCC CTCCCGCTGC 
GAAGGCTTCG GACTCGTCCA GGTGGAAGCC ATGTGCTGCG GGCTGCCTAT TCTGGCGGCG 
GATATACCGA TCTGTCGGGA AATAGTGGAA AAACATCACG CCGGCATCCT TTTTGAGTCG 
GACAATCCGG AAGACCTGTG CCGGGCCATG CGTGAAATGA CGGCCTCAGA CCTCTCATCC 
TATGCGGCAA ACGGCCTGGC CGCGGCGCCT CTGTTCAATC TGGAGCAGAC TGTCTCTGAA 
TGGGAAAACA TGTTCAACGC AGTAAAATCA TGA

Protein sequence

MKICFVAWSD FGIGGVPRVL TCLMDALSRK HDVSLYSLKN LPPSGIQGIN REQIHIYCRE 
MNLYEKIRRS AADILVCKTP LFSSALGCRL YAAARYTSGF KKALTNHLNK HQYDVVIFGS 
GFEDSLLLAL TKNKLLPSMR ILTWSHASYD NYFTNMGSFF SRYMKEAIKA YYHRFDEIIV 
LSDGDEKEFR EKHHLPARRI YNPNTMNPAR KSTLTSKTFV YVGALSHQKG TDLAVRAFHK 
FIETDQEWNL HIYGEGPLKG WIEEYVSSNG LHHRIILHGP CGNMEEEFPR HSILLFPSRC 
EGFGLVQVEA MCCGLPILAA DIPICREIVE KHHAGILFES DNPEDLCRAM REMTASDLSS 
YAANGLAAAP LFNLEQTVSE WENMFNAVKS