Gene EcDH1_3554 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3554
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	3824239
End bp	3825570
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	53%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	ACX41168
Protein GI	260450746
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAACCGT CCAGAAACTT TGACGATCTC AAATTCTCCT CTATTCACCG CCGCATTTTG 
CTGTGGGGAA GCGGTGGTCC GTTTCTGGAT GGTTATGTAC TGGTAATGAT TGGCGTGGCG 
CTGGAGCAAC TGACGCCGGC GCTGAAACTG GACGCTGACT GGATTGGCTT GCTGGGCGCG 
GGAACGCTCG CCGGGCTGTT CGTTGGCACA TCGCTGTTTG GTTATATTTC CGATAAAGTC 
GGACGGCGCA AAATGTTCCT CATTGATATC ATCGCCATCG GCGTGATATC GGTGGCGACG 
ATGTTTGTTT CATCCCCCGT CGAACTGTTG GTGATGCGGG TACTTATCGG CATTGTCATC 
GGTGCAGATT ATCCCATCGC CACCTCAATG ATCACCGAGT TCTCCAGTAC CCGTCAGCGG 
GCGTTTTCCA TCAGCTTTAT TGCCGCGATG TGGTATGTCG GCGCGACCTG TGCCGATCTG 
GTCGGCTACT GGCTTTATGA TGTGGAAGGC GGCTGGCGCT GGATGCTGGG TAGCGCGGCG 
ATCCCCTGTT TGTTGATTTT GATTGGTCGA TTCGAACTGC CTGAATCTCC CCGCTGGTTA 
TTACGCAAAG GGCGAGTAAA AGAGTGCGAA GAGATGATGA TCAAACTGTT TGGCGAACCG 
GTGGCTTTCG ATGAAGAGCA GCCGCAGCAA ACCCGTTTTC GCGATCTGTT TAATCGCCGC 
CATTTTCCTT TTGTTCTGTT TGTTGCCGCC ATCTGGACCT GCCAGGTGAT CCCAATGTTC 
GCCATTTACA CCTTTGGCCC GCAAATCGTT GGTTTGTTGG GATTGGGGGT TGGCAAAAAC 
GCGGCACTAG GGAATGTGGT GATTAGCCTG TTCTTTATGC TCGGCTGTAT TCCGCCGATG 
CTGTGGTTAA ACACTGCCGG ACGGCGTCCA TTGTTGATTG GCAGCTTTGC CATGATGACG 
CTGGCGCTGG CGGTTTTGGG GCTAATCCCG GATATGGGGA TCTGGCTGGT AGTGATGGCC 
TTTGCGGTGT ATGCCTTTTT CTCTGGCGGG CCGGGTAATT TGCAGTGGCT CTATCCTAAT 
GAACTCTTCC CGACAGATAT CCGCGCCTCT GCCGTGGGCG TGATTATGTC CTTAAGTCGT 
ATTGGCACCA TTGTTTCGAC CTGGGCACTA CCGATCTTTA TCAATAATTA CGGTATCAGT 
AACACGATGC TAATGGGGGC GGGTATCTCG CTGTTTGGCT TGTTGATTTC CGTAGCGTTT 
GCCCCGGAGA CTCGAGGGAT GTCACTGGCG CAGACCAGCA ATATGACGAT CCGCGGGCAG 
AGAATGGGGT AA

Protein sequence

MQPSRNFDDL KFSSIHRRIL LWGSGGPFLD GYVLVMIGVA LEQLTPALKL DADWIGLLGA 
GTLAGLFVGT SLFGYISDKV GRRKMFLIDI IAIGVISVAT MFVSSPVELL VMRVLIGIVI 
GADYPIATSM ITEFSSTRQR AFSISFIAAM WYVGATCADL VGYWLYDVEG GWRWMLGSAA 
IPCLLILIGR FELPESPRWL LRKGRVKECE EMMIKLFGEP VAFDEEQPQQ TRFRDLFNRR 
HFPFVLFVAA IWTCQVIPMF AIYTFGPQIV GLLGLGVGKN AALGNVVISL FFMLGCIPPM 
LWLNTAGRRP LLIGSFAMMT LALAVLGLIP DMGIWLVVMA FAVYAFFSGG PGNLQWLYPN 
ELFPTDIRAS AVGVIMSLSR IGTIVSTWAL PIFINNYGIS NTMLMGAGIS LFGLLISVAF 
APETRGMSLA QTSNMTIRGQ RMG