Gene Ent638_2036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_2036
Symbol
ID	5113452
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	+
Start bp	2209100
End bp	2210308
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	57%
IMG OID	640492224
Product	major facilitator transporter
Protein accession	YP_001176763
Protein GI	146311689
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.296988
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.627164
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTGTA CGGAATACCC TGGCGCGTCA GCACCGCTAA CCTCTCGCAT GATTTTACTC 
TTTGCGACAC TCTGCGCCTT TGCCGTGGCG AACGTTTACA TGACGCAGCC GCTGCTGGAC 
CAAATAGCCC TCTCGCTCGG CGAGAATGAA TCCAGAATGG GCATGATCAT CACCGCGACA 
CAAACAGGTT ACGCGCTGGG GCTGATGCTG CTGGTTCCGC TTGGTGACCT GATTAACCGC 
AAACGGCTGG TCACGCTCAT GTTACTGGCA AGCAGTGGGT TGTTGCTCGC TGCGTCCATG 
GCCTCTTCTC TTTACGGGTT AAGCGGCATG CTGAGTCTGG TGGGCGCGAT GGCGGTAGTC 
GTGCAAATCA TCGTGGCGTT TGCCGCCAGT CTGTCGGCCC CGGAAAAGCG CGGTCAGGTT 
ACGGGCATCG TCACCAGCGG TGTGGTGATG GGTATTTTGC TCGCGCGTCT GGTCTCGGGC 
TTTTTGGCGC AGTGGGCGGG CTGGAGAGTC GCGATTATGG TCTCGGCCGG GGCGATGTTC 
CTGATGGCGT TGCTTTTCAT CCGTACTGCG CCGGATGAGC GTAAACAAGA CTCTACGCAA 
TCGTACGGGC AACTGATGCT GTCGGTGTTT TCCCTGTGGC GTGAAATCCC CGCGCTGCGC 
TCACGCGGCA TTCTGGCTTT GCTGATATTT ATGAATTTTA GCGTGCTATG GACATCCCTG 
GTTTTCCCGC TCAGCCATGC GCCGTTTAGT CTGACCACTG CACAGATTGG TCTGTTCGGT 
CTGGCAGGTA TTGCTGGCGC ACTGGCGGCA AGGCAAGCCG GAACCTTGGC CGATCGAGGC 
CACGGACAAC ACGTCACCGG ATTCGCGCTG ATGTTGCTAT TGATCTCATG GATGGCGATG 
GCATGGGGCG GCTCATCGCT AATTGCGCTG ACGTTAGGCA TCATCCTGCT GGACTTTGCC 
GTGCAGGCGG TTCACGTCAC TAGCCAGAGC ATGATTTTTG CAACAAGACC GCAAGCCACC 
AGCCGACTGG TGGCCGCTTA TATGTTTTTC TACTCTGTCG GCAGCGCCAT CGGTGCCCTG 
CTCGCCACTC ACGTATGGAG TCAATTCGGC TGGACGGGCG TGTGTCTTTT GGGCGCGACA 
ATTAGCGTAC TGGCGTTGCT TTACTGGCTG CTGATTGACA GGAGTCGGCA CAGCCAGACA 
GCTGATTAA

Protein sequence

MTCTEYPGAS APLTSRMILL FATLCAFAVA NVYMTQPLLD QIALSLGENE SRMGMIITAT 
QTGYALGLML LVPLGDLINR KRLVTLMLLA SSGLLLAASM ASSLYGLSGM LSLVGAMAVV 
VQIIVAFAAS LSAPEKRGQV TGIVTSGVVM GILLARLVSG FLAQWAGWRV AIMVSAGAMF 
LMALLFIRTA PDERKQDSTQ SYGQLMLSVF SLWREIPALR SRGILALLIF MNFSVLWTSL 
VFPLSHAPFS LTTAQIGLFG LAGIAGALAA RQAGTLADRG HGQHVTGFAL MLLLISWMAM 
AWGGSSLIAL TLGIILLDFA VQAVHVTSQS MIFATRPQAT SRLVAAYMFF YSVGSAIGAL 
LATHVWSQFG WTGVCLLGAT ISVLALLYWL LIDRSRHSQT AD