Gene Ent638_2000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_2000
Symbol
ID	5113416
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	-
Start bp	2172261
End bp	2173457
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	57%
IMG OID	640492188
Product	sugar efflux transporter
Protein accession	YP_001176727
Protein GI	146311653
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00880] Multidrug resistance protein

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0810814
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAACAA ACACGGTTTC CCGCAAGGTC GCGTGGCTAC GTGTGGTCAC GCTGGCCATT 
GCCGCTTTTA TTTTTAATAC CACTGAATTT GTCCCGGTTG GCCTGCTGTC TGATATTGCC 
CAAAGCTTCC AGATGGAAAC GGCGCAGGTC GGCATTATGC TGACGATTTA CGCTTGGGTC 
GTGGCACTGA TGTCATTGCC TTTTATGCTG CTGACCAGCC AGATGGAGCG CCGCAAACTG 
CTGATCGGGC TATTTGTGCT GTTTATCGCC AGCCATGTGC TCTCTTTCCT GGCGTGGAAT 
TTTAACGTGC TGGTGATAAG CCGCATTGGT ATTGCCTTTG CGCACGCGAT TTTTTGGTCG 
ATTACTGCCT CGCTCGCCAT CCGTCTGGCA CCGGCCGGTA AACGCGCACA GGCGCTCAGT 
CTGCTGGCGA CCGGTACGGC GCTGGCGATG GTATTGGGTC TGCCGATTGG CCGCATCGTC 
GGGCAATACT TTGGCTGGCG CACCACCTTC TTCGCGATTG GCCTGGGCGC GCTGATTACG 
CTGCTGTGTT TGATTAAACT GCTGCCAAAG CTGCCGAGCG AACATTCTGG CTCGCTGAAA 
AGTCTGCCGC TGCTGTTCCG TCGCCCGGCG CTGATGAGCA TTTATCTGCT GACCGTCGTG 
GTCGTGACCG CGCATTACAC GGCTTACAGT TACATCGAGC CCTTTGTGCA GGTGGTGGCG 
GGCTTTAGCG CTAACTTCGC CACGGTATTG CTGCTGATTC TGGGCGGCGC GGGGATTATC 
GGCAGCGTGC TGTTCGGGAA ACTCGGGAAT AAACACGCCT CACTGCTGGT CAGCAGCGCC 
ATTGGCCTGC TCCTGGCGTG TCTGTTGCTG TTGATGCCCG CAGCGCAGAG CGAAACTCAT 
CTGGCCATAC TGAGCATTTT CTGGGGCGTG GCGATCATGA TTATCGGCCT GGGCATGCAG 
GTTAAAGTGC TGGCGCTGGC GCCTGATGCC ACGGACGTGG CGATGTCGCT CTTTTCAGGG 
ATTTTCAATA TCGGCATCGG CGCAGGCGCG CTGGTGGGGA ATCAAATCAG CCTTCATCTG 
TCGATGTCGG CGATTGGTTA TCTGGGGGCA ATTCCCGCGC TGGCGGCATT GATCTGGTCG 
ATTCTGATTT TCCGCAAATG GCCGGTGGCT CTCGAAGAGC AGCCGCATCA CGGATAA

Protein sequence

MTTNTVSRKV AWLRVVTLAI AAFIFNTTEF VPVGLLSDIA QSFQMETAQV GIMLTIYAWV 
VALMSLPFML LTSQMERRKL LIGLFVLFIA SHVLSFLAWN FNVLVISRIG IAFAHAIFWS 
ITASLAIRLA PAGKRAQALS LLATGTALAM VLGLPIGRIV GQYFGWRTTF FAIGLGALIT 
LLCLIKLLPK LPSEHSGSLK SLPLLFRRPA LMSIYLLTVV VVTAHYTAYS YIEPFVQVVA 
GFSANFATVL LLILGGAGII GSVLFGKLGN KHASLLVSSA IGLLLACLLL LMPAAQSETH 
LAILSIFWGV AIMIIGLGMQ VKVLALAPDA TDVAMSLFSG IFNIGIGAGA LVGNQISLHL 
SMSAIGYLGA IPALAALIWS ILIFRKWPVA LEEQPHHG