Gene Amuc_1552 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1552
Symbol
ID	6273653
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	1864700
End bp	1865860
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	57%
IMG OID	642613611
Product	major facilitator superfamily MFS_1
Protein accession	YP_001878154
Protein GI	187736042
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0738] Fucose permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATATGC CTCTTCCTAA AACGACGCAA GGTGTTTATC GTCTGTCGGT CAGTACCTTT 
TATTTTCTTC AGGGTTTGGT GTTCGCCAGT TGGGCATCCC GCATCCCGGA CATCAAAAGT 
GCATTGGGGT TGAACGATGC CGACTTGGGG TCCGTTCTCT TTGCCGTCCC GGTGGGGCAG 
ATGTCCGCCA TGGCGCTATC CGGTTACCTG GTTGGCCGTT GCGGCAGCCG GAAAATACTG 
ATGGCGGCAT CCGTCTTTTA TCCTGCCGTG CTTGTATGCC TGGGTATGGC GGGGTCTTTC 
TGGGAACTGG CGGCCGGGTT ATTTTTCTTT GGGGTAGCCG CAAATCTGAC GAATATATCC 
GTCAATACGC AGGGAGTGGG AGTGGAACGG CTGTACCAGT GCAGCATCAT GGCCCGGTTC 
CACGGTTTAT GGAGCCTGGC GGGTTTTTTC GGAGCTTTGC TGGGAGCTGC CATGGTGGAC 
TGGCATATTT CTGCGGAAAC GCATTTCATC GCCATTTTCC TGATATGCAT GATTATTCTG 
GCCGTTTTTT CCCCCTCTCT TCTGCCGAGG GATGCCCGGC GTTCCTCCTC CCAGGGAGGC 
GGCATGTTCC GGAGCATGGA TGCTTATGTA CTGGTCATCG GGCTGATCGC CTTCGGAAGC 
ATGGTGAGCG AAGGAACCAT GTTTGACTGG AGCGGCGTGT ACTTTGAAAG CGTGGTAAAA 
CCCGGTCCGG GGCTGGTGCA GATGGGATAC GTGGCATTCA TGAGCACCAT GGCCCTGGGG 
CGTTTTACGG CAGACCGCCT GGTGATGCGC TTCGGGCCTG TGCGGGTTCT GCGCGCCAGC 
GGCATCCTTA TTGCCTCCGG ATTGCTCGTC TCCGTCCTGT TCCCGATGCT GTGGTCCGCC 
ACGCTGGGCT TTCTGCTGGT GGGTTTTGGC ACCTCTTCCA TTGTCCCGCT CTGCTACAGC 
ATGGCCGGGA AATCCCGGAA AATGATTCCC AGCATGGCGC TGGCTTCCGT TTCTACCATC 
GGCTTTCTGG GGTTCCTGAT GGGGCCGCCG GTCATTGGTC ATATTGCCCA TGCTTCCTCC 
CTCCGGTGGT CTTTCTCCCT GATTGCCCTG GTTGGACTGG GGACGGCATT CATTGCCCCT 
TTCCTCAAGA AATATAGGTA A

Protein sequence

MNMPLPKTTQ GVYRLSVSTF YFLQGLVFAS WASRIPDIKS ALGLNDADLG SVLFAVPVGQ 
MSAMALSGYL VGRCGSRKIL MAASVFYPAV LVCLGMAGSF WELAAGLFFF GVAANLTNIS 
VNTQGVGVER LYQCSIMARF HGLWSLAGFF GALLGAAMVD WHISAETHFI AIFLICMIIL 
AVFSPSLLPR DARRSSSQGG GMFRSMDAYV LVIGLIAFGS MVSEGTMFDW SGVYFESVVK 
PGPGLVQMGY VAFMSTMALG RFTADRLVMR FGPVRVLRAS GILIASGLLV SVLFPMLWSA 
TLGFLLVGFG TSSIVPLCYS MAGKSRKMIP SMALASVSTI GFLGFLMGPP VIGHIAHASS 
LRWSFSLIAL VGLGTAFIAP FLKKYR