Gene EcDH1_2034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_2034
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	2194295
End bp	2195596
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	51%
IMG OID
Product	histidine kinase
Protein accession	ACX39691
Protein GI	260449269
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.0105815
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAC TGTTTATCCA GTTTTACCTG TTATTGTTTG TCTGCTTCCT TGTGATGTCT 
CTGCTGGTTG GGCTGGTGTA CAAATTTACC GCCGAACGCG CGGGCAAACA GTCGCTGGAT 
GATTTGATGA ACAGTTCGCT GTATCTGATG CGCAGCGAAT TGCGTGAGAT CCCCCCACAC 
GACTGGGGTA AAACTCTGAA AGAGATGGAT TTAAATCTCT CTTTCGATCT GCGTGTCGAG 
CCACTGAGTA AATACCATCT TGATGATATT TCCATGCACC GACTGCGTGG CGGCGAAATT 
GTCGCCCTGG ACGATCAGTA CACGTTTTTG CAGCGTATCC CGCGCAGCCA CTACGTGCTG 
GCAGTTGGTC CTGTTCCTTA TCTTTATTAT CTCCATCAGA TGCGATTGCT GGATATCGCC 
CTGATCGCTT TTATTGCTAT TTCCCTCGCC TTTCCGGTGT TTATCTGGAT GCGTCCGCAC 
TGGCAGGATA TGTTAAAACT GGAAGCAGCG GCGCAACGAT TTGGCGATGG GCATCTCAAT 
GAACGTATCC ACTTTGATGA GGGTTCGAGC TTTGAACGAC TTGGCGTCGC ATTTAACCAG 
ATGGCGGACA ATATCAACGC CTTAATTGCC AGCAAAAAAC AGCTTATTGA CGGTATCGCT 
CACGAACTGC GAACACCGTT AGTGCGCCTG CGTTATCGAC TGGAGATGAG CGATAACCTG 
AGCGCCGCCG AATCCCAGGC GTTGAATCGT GATATCAGTC AACTTGAAGC TTTAATTGAA 
GAGCTGCTGA CTTATGCCCG ACTCGATCGC CCACAAAACG AGCTTCATCT TAGCGAACCA 
GACCTGCCGT TGTGGCTGTC AACGCATCTG GCAGATATTC AGGCAGTAAC GCCCGATAAA 
ACGGTACGGA TAAAAACGCT CGTGCAAGGC CATTATGCGG CGTTGGATAT GCGCTTAATG 
GAGCGCGTGC TGGATAATTT GCTCAATAAC GCCCTGCGGT ACTGCCATTC AACGGTTGAA 
ACCAGCCTGC TACTGTCGGG GAATAGAGCG ACATTAATTG TTGAGGATGA TGGCCCAGGG 
ATTGCCCCAG AAAACCGCGA ACATATCTTT GAACCTTTTG TTCGCCTCGA TCCCAGCCGG 
GATCGCTCAA CCGGCGGCTG CGGGCTGGGG CTGGCAATTG TCCACTCTAT AGCACTGGCA 
ATGGGCGGTA CGGTTAATTG TGACACCAGC GAACTGGGTG GTGCCCGCTT CTCGTTTAGC 
TGGCCGTTAT GGCATAACAT CCCGCAATTT ACCTCTGCCT GA

Protein sequence

MKKLFIQFYL LLFVCFLVMS LLVGLVYKFT AERAGKQSLD DLMNSSLYLM RSELREIPPH 
DWGKTLKEMD LNLSFDLRVE PLSKYHLDDI SMHRLRGGEI VALDDQYTFL QRIPRSHYVL 
AVGPVPYLYY LHQMRLLDIA LIAFIAISLA FPVFIWMRPH WQDMLKLEAA AQRFGDGHLN 
ERIHFDEGSS FERLGVAFNQ MADNINALIA SKKQLIDGIA HELRTPLVRL RYRLEMSDNL 
SAAESQALNR DISQLEALIE ELLTYARLDR PQNELHLSEP DLPLWLSTHL ADIQAVTPDK 
TVRIKTLVQG HYAALDMRLM ERVLDNLLNN ALRYCHSTVE TSLLLSGNRA TLIVEDDGPG 
IAPENREHIF EPFVRLDPSR DRSTGGCGLG LAIVHSIALA MGGTVNCDTS ELGGARFSFS 
WPLWHNIPQF TSA