Gene Amuc_0020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0020
Symbol
ID	6275218
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	25433
End bp	26587
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	60%
IMG OID	642612060
Product	putative MFS family transporter protein
Protein accession	YP_001876648
Protein GI	187734536
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTACAT TTACCTGGCC TATTGCCCTG CTGCTGGCGG GGCTTCTTTT CCAGACAGTG 
GCGTTTGCCG TGTTGAATAC GGTTGTTCCC CTGTGGATGG AGCAATTTGA TGCCGCCACC 
TGGGAGGCAG GGCTGGTGGG GGCTTTCTTT TTTCTCGGGA ACCTGGCCGG AACGCTGCTG 
GCTGGCGGCG TGATTCGCCG GGCCGGGTTC AAAGGAAGTT ACCAATATGC ATGCCTTTTA 
TGCGCAGTCT CCACCGTTCT GCTGCCTGTG TTTCCCGGCG TGCCGGCCTG GAGCGGCCTC 
CGGCTGCTGG CGGGGATCAG CTGCGCCCTG GTCTGGGTGG TGGTGGAAAG CGCCCTGCTG 
AGGGCCGGAA CGCTGCAAAC CCGCGGCATT CTGCTGGCTT CCTACATGGT GGTTTATTAT 
CTGGGTACGG TGCTGGGGCA GTTGCTTCTG GGCTGGTTCC CCAGCGATAT GCCCCTGATT 
GTGACGGAAG TCTGCATTTT ATCAGTGGCG GGCATGGTTC CGCTGATGTT TGCGCGTCTG 
GAGCCGGGCA ATGGACAGGT TTCATCCTCC TCCCATATAG AGATTCGGAC ACTGCTGAGA 
CGCCGCAGCG TCTTTCTGGG TGTTGTGGGA TGTGTGATTT CCGGCGTGGT ATTGGGTACT 
ATTTATTGCC TGATGCCCCT GTTCCTGAAG CACCAGGGAA TGGACCACTC TTCCGTGGGA 
TACTGGATGG CCCTGCTGAT TGCCGCTGCC ATTCTGGGGC AGTGGCCCAT GGGGCGGCTG 
GCGGACAGGT ACGGCCGCGC TTTCGTCATG AAATGCCAGT CCCTGCTGGT GGCGGCGGCC 
TGTGCCGGGC TGATGCTGAA GGGGGGGCTG ATGGCTCCCT CCCTGATTGC TCTGGGGCTG 
GCCGGATTTT CCCTGTACCC TGTTGCCATG GCCTGGGGAT GCGAGGAAGC TTCCCGGGAT 
GAACTGGTGA CCATGAACCA GCTTCTGCTG TTGAGTTATT CCCTGGGCAC GCTGGCCGGC 
CCTTCCCTGA CTTCGTTCCT GATGCAGAGG TATTCCGACA ATTGGATGCC TATGGTTATT 
GCGCTGGTGG CCCTTTCCTT CATGCCTGTG CTGATGCTGG GCGGCGGCCA CGGAAGGAGA 
AAGCTGTCCC GGTAA

Protein sequence

MRTFTWPIAL LLAGLLFQTV AFAVLNTVVP LWMEQFDAAT WEAGLVGAFF FLGNLAGTLL 
AGGVIRRAGF KGSYQYACLL CAVSTVLLPV FPGVPAWSGL RLLAGISCAL VWVVVESALL 
RAGTLQTRGI LLASYMVVYY LGTVLGQLLL GWFPSDMPLI VTEVCILSVA GMVPLMFARL 
EPGNGQVSSS SHIEIRTLLR RRSVFLGVVG CVISGVVLGT IYCLMPLFLK HQGMDHSSVG 
YWMALLIAAA ILGQWPMGRL ADRYGRAFVM KCQSLLVAAA CAGLMLKGGL MAPSLIALGL 
AGFSLYPVAM AWGCEEASRD ELVTMNQLLL LSYSLGTLAG PSLTSFLMQR YSDNWMPMVI 
ALVALSFMPV LMLGGGHGRR KLSR