Gene EcDH1_3261 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3261
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	3503436
End bp	3504527
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	56%
IMG OID
Product	transcriptional regulator, LacI family
Protein accession	ACX40885
Protein GI	260450463
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0000000862656
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGTGAATG TGAAACCAGT AACGTTATAC GATGTCGCAG AGTATGCCGG TGTCTCTTAT 
CAGACCGTTT CCCGCGTGGT GAACCAGGCC AGCCACGTTT CTGCGAAAAC GCGGGAAAAA 
GTGGAAGCGG CGATGGCGGA GCTGAATTAC ATTCCCAACC GCGTGGCACA ACAACTGGCG 
GGCAAACAGT CGTTGCTGAT TGGCGTTGCC ACCTCCAGTC TGGCCCTGCA CGCGCCGTCG 
CAAATTGTCG CGGCGATTAA ATCTCGCGCC GATCAACTGG GTGCCAGCGT GGTGGTGTCG 
ATGGTAGAAC GAAGCGGCGT CGAAGCCTGT AAAGCGGCGG TGCACAATCT TCTCGCGCAA 
CGCGTCAGTG GGCTGATCAT TAACTATCCG CTGGATGACC AGGATGCCAT TGCTGTGGAA 
GCTGCCTGCA CTAATGTTCC GGCGTTATTT CTTGATGTCT CTGACCAGAC ACCCATCAAC 
AGTATTATTT TCTCCCATGA AGACGGTACG CGACTGGGCG TGGAGCATCT GGTCGCATTG 
GGTCACCAGC AAATCGCGCT GTTAGCGGGC CCATTAAGTT CTGTCTCGGC GCGTCTGCGT 
CTGGCTGGCT GGCATAAATA TCTCACTCGC AATCAAATTC AGCCGATAGC GGAACGGGAA 
GGCGACTGGA GTGCCATGTC CGGTTTTCAA CAAACCATGC AAATGCTGAA TGAGGGCATC 
GTTCCCACTG CGATGCTGGT TGCCAACGAT CAGATGGCGC TGGGCGCAAT GCGCGCCATT 
ACCGAGTCCG GGCTGCGCGT TGGTGCGGAT ATCTCGGTAG TGGGATACGA CGATACCGAA 
GACAGCTCAT GTTATATCCC GCCGTTAACC ACCATCAAAC AGGATTTTCG CCTGCTGGGG 
CAAACCAGCG TGGACCGCTT GCTGCAACTC TCTCAGGGCC AGGCGGTGAA GGGCAATCAG 
CTGTTGCCCG TCTCACTGGT GAAAAGAAAA ACCACCCTGG CGCCCAATAC GCAAACCGCC 
TCTCCCCGCG CGTTGGCCGA TTCATTAATG CAGCTGGCAC GACAGGTTTC CCGACTGGAA 
AGCGGGCAGT GA

Protein sequence

MVNVKPVTLY DVAEYAGVSY QTVSRVVNQA SHVSAKTREK VEAAMAELNY IPNRVAQQLA 
GKQSLLIGVA TSSLALHAPS QIVAAIKSRA DQLGASVVVS MVERSGVEAC KAAVHNLLAQ 
RVSGLIINYP LDDQDAIAVE AACTNVPALF LDVSDQTPIN SIIFSHEDGT RLGVEHLVAL 
GHQQIALLAG PLSSVSARLR LAGWHKYLTR NQIQPIAERE GDWSAMSGFQ QTMQMLNEGI 
VPTAMLVAND QMALGAMRAI TESGLRVGAD ISVVGYDDTE DSSCYIPPLT TIKQDFRLLG 
QTSVDRLLQL SQGQAVKGNQ LLPVSLVKRK TTLAPNTQTA SPRALADSLM QLARQVSRLE 
SGQ