Gene EcDH1_1867 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1867
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	2018249
End bp	2019628
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	49%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	ACX39525
Protein GI	260449103
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00000517052
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACAGA TAACAAAACC GCATTGTGGT GCACGGCTGG ATCGCTTACC GGATTGCCGC 
TGGCATTCAT CAATGTTTGC CATCGTCGCG TTTGGCTTGC TTGTCTGCTG GAGTAATGCC 
GTTGGTGGCT TGATCCTCGC GCAGCTGAAA GCGTTGGGCT GGACAGATAA TTCCACCACA 
GCCACATTCT CAGCAATCAC GACCGCCGGA ATGTTTCTCG GTGCGCTGGT GGGCGGCATC 
ATTGGCGACA AAACCGGTCG CAGAAATGCG TTCATCCTCT ATGAGGCCAT TCATATTGCC 
TCGATGGTTG TCGGTGCTTT CTCACCGAAT ATGGATTTCC TTATTGCCTG CCGTTTTGTG 
ATGGGAGTTG GGCTGGGAGC TTTACTGGTT ACGCTGTTTG CTGGTTTCAC CGAATATATG 
CCCGGTAGAA ATCGTGGAAC GTGGTCAAGT CGGGTTTCCT TTATTGGCAA CTGGTCATAT 
CCGCTCTGTT CATTGATAGC GATGGGACTC ACGCCGCTGA TTAGTGCAGA GTGGAACTGG 
CGGGTACAAC TGCTTATCCC TGCAATATTG TCGCTTATCG CTACGGCGCT GGCCTGGCGC 
TACTTTCCTG AATCCCCGCG CTGGCTGGAA TCGCGCGGAC GGTATCAGGA AGCCGAGAAA 
GTCATGCGGA GTATAGAAGA AGGCGTCATA CGCCAGACGG GTAAACCTTT GCCGCCTGTG 
GTTATTGCTG ATGACGGTAA AGCGCCACAA GCGGTGCCGT ATTCAGCCTT ACTGACAGGA 
GTATTACTGA AACGCGTGAT ATTAGGCTCT TGTGTGCTGA TTGCCATGAA CGTTGTGCAG 
TACACACTAA TTAACTGGTT GCCAACAATA TTCATGACCC AGGGGATTAA TTTAAAAGAC 
TCGATTGTTT TAAATACCAT GAGTATGTTT GGCGCGCCAT TTGGTATTTT TATTGCCATG 
CTGGTGATGG ATAAAATTCC GCGTAAAACA ATGGGTGTGG GGCTATTAAT CCTGATTGCG 
GTGCTCGGAT ATATCTATTC ACTGCAAACC AGTATGTTGC TCATAACGTT GATTGGTTTC 
TTCCTGATTA CTTTCGTCTA TATGTACGTT TGCTATGCCT CGGCAGTGTA TGTCCCTGAA 
ATCTGGCCGA CAGAGGCCAA ACTCCGTGGC TCCGGTCTGG CGAATGCGGT AGGGCGAATC 
AGTGGTATTG CCGCACCTTA TGCCGTTGCA GTGCTGCTCA GTAGTTATGG CGTTACGGGA 
GTCTTTATTC TTCTGGGGGC GGTTTCAATT ATTGTCGCAA TTGCTATCGC CACCATTGGA 
ATCGAAACCA AAGGTGTCTC CGTTGAAAGT TTAAGTATTG ATGCAGTAGC CAATAAATAA

Protein sequence

MEQITKPHCG ARLDRLPDCR WHSSMFAIVA FGLLVCWSNA VGGLILAQLK ALGWTDNSTT 
ATFSAITTAG MFLGALVGGI IGDKTGRRNA FILYEAIHIA SMVVGAFSPN MDFLIACRFV 
MGVGLGALLV TLFAGFTEYM PGRNRGTWSS RVSFIGNWSY PLCSLIAMGL TPLISAEWNW 
RVQLLIPAIL SLIATALAWR YFPESPRWLE SRGRYQEAEK VMRSIEEGVI RQTGKPLPPV 
VIADDGKAPQ AVPYSALLTG VLLKRVILGS CVLIAMNVVQ YTLINWLPTI FMTQGINLKD 
SIVLNTMSMF GAPFGIFIAM LVMDKIPRKT MGVGLLILIA VLGYIYSLQT SMLLITLIGF 
FLITFVYMYV CYASAVYVPE IWPTEAKLRG SGLANAVGRI SGIAAPYAVA VLLSSYGVTG 
VFILLGAVSI IVAIAIATIG IETKGVSVES LSIDAVANK