Gene EcDH1_3881 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3881
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	4182577
End bp	4184079
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	50%
IMG OID
Product	metabolite/H+ symporter, major facilitator superfamily (MFS)
Protein accession	ACX41482
Protein GI	260451060
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	56
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGAAAA GGAAAAAAGT AAAACCGATT ACCCTTCGTG ATGTCACCAT TATTGATGAC 
GGTAAACTGC GTAAAGCCAT TACCGCAGCA TCACTGGGTA ATGCAATGGA ATGGTTCGAT 
TTTGGTGTTT ATGGTTTTGT TGCTTACGCA TTAGGTAAAG TTTTTTTCCC GGGGGCTGAC 
CCCAGCGTGC AGATGGTTGC TGCACTTGCC ACTTTCTCCG TTCCCTTTCT GATTCGACCG 
CTTGGCGGAC TCTTCTTTGG TATGTTGGGC GATAAATATG GTCGCCAGAA GATCCTCGCT 
ATCACTATTG TGATTATGTC GATCAGTACG TTCTGTATTG GCTTAATACC GTCCTACGAC 
ACGATTGGTA TTTGGGCACC GATTCTGCTG TTGATCTGTA AGATGGCACA AGGTTTCTCG 
GTCGGCGGTG AATATACCGG GGCGTCGATA TTTGTTGCGG AATACTCCCC TGACCGTAAA 
CGTGGCTTTA TGGGCAGCTG GCTGGACTTC GGTTCTATTG CCGGGTTTGT GCTGGGTGCG 
GGCGTGGTGG TGTTAATTTC GACCATTGTC GGCGAAGCGA ACTTCCTCGA TTGGGGCTGG 
CGTATTCCGT TCTTTATCGC TCTGCCGTTA GGGATTATCG GGCTTTACCT GCGCCATGCG 
CTGGAAGAGA CTCCGGCGTT CCAGCAGCAT GTCGATAAAC TGGAACAGGG CGACCGTGAA 
GGTTTGCAGG ATGGCCCGAA AGTCTCGTTT AAAGAGATTG CCACTAAATA CTGGCGCAGC 
CTGTTGACAT GTATTGGTCT GGTAATTGCC ACCAACGTGA CTTACTACAT GTTGCTGACC 
TATATGCCGA GTTATTTGTC GCATAACCTG CATTACTCCG AAGACCACGG GGTGCTGATT 
ATTATCGCCA TTATGATCGG TATGCTGTTT GTCCAGCCGG TGATGGGCTT GCTGAGTGAC 
CGTTTTGGCC GTCGTCCGTT TGTGCTACTT GGTAGTGTTG CCCTGTTTGT GTTGGCGATC 
CCGGCGTTTA TTCTGATTAA CAGTAACGTC ATCGGCCTGA TTTTTGCCGG GTTACTGATG 
CTGGCGGTGA TCCTTAACTG CTTTACGGGC GTTATGGCTT CTACCTTGCC AGCGATGTTC 
CCGACGCATA TCCGTTACAG CGCGCTGGCG GCGGCATTTA ATATTTCGGT GCTGGTTGCC 
GGTCTGACGC CAACGCTGGC GGCCTGGCTG GTCGAAAGCT CGCAGAATCT GATGATGCCT 
GCCTATTACC TGATGGTAGT GGCGGTGGTT GGTTTAATCA CCGGCGTAAC CATGAAAGAG 
ACGGCAAATC GTCCGTTGAA AGGTGCGACA CCGGCGGCGT CAGATATACA GGAAGCGAAG 
GAAATTCTCG TCGAGCATTA CGATAATATC GAGCAGAAAA TCGATGATAT TGACCACGAG 
ATTGCCGATT TGCAGGCGAA ACGTACCCGC CTGGTGCAGC AACATCCGCG AATTGATGAA 
TAA

Protein sequence

MLKRKKVKPI TLRDVTIIDD GKLRKAITAA SLGNAMEWFD FGVYGFVAYA LGKVFFPGAD 
PSVQMVAALA TFSVPFLIRP LGGLFFGMLG DKYGRQKILA ITIVIMSIST FCIGLIPSYD 
TIGIWAPILL LICKMAQGFS VGGEYTGASI FVAEYSPDRK RGFMGSWLDF GSIAGFVLGA 
GVVVLISTIV GEANFLDWGW RIPFFIALPL GIIGLYLRHA LEETPAFQQH VDKLEQGDRE 
GLQDGPKVSF KEIATKYWRS LLTCIGLVIA TNVTYYMLLT YMPSYLSHNL HYSEDHGVLI 
IIAIMIGMLF VQPVMGLLSD RFGRRPFVLL GSVALFVLAI PAFILINSNV IGLIFAGLLM 
LAVILNCFTG VMASTLPAMF PTHIRYSALA AAFNISVLVA GLTPTLAAWL VESSQNLMMP 
AYYLMVVAVV GLITGVTMKE TANRPLKGAT PAASDIQEAK EILVEHYDNI EQKIDDIDHE 
IADLQAKRTR LVQQHPRIDE