Gene EcDH1_0035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_0035
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	33626
End bp	35128
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	57%
IMG OID
Product	histidine kinase
Protein accession	ACX37733
Protein GI	260447311
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	82
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGACGT TGTTCTCCCG CTTAATTACC GTTATTGCCT GCTTTTTTAT CTTCTCTGCC 
GCATGGTTTT GCCTGTGGAG TATCAGCCTG CATCTGGTTG AGCGCCCTGA TATGGCGGTG 
CTGTTATTTC CGTTTGGTCT GCGTCTGGGG CTAATGCTGC AATGCCCGCG CGGATACTGG 
CCCGTATTGC TGGGCGCGGA GTGGCTGCTG ATTTACTGGC TAACGCAGGC GGTCGGTTTA 
ACCCATTTTC CGTTATTGAT GATCGGTAGT TTACTGACGT TACTGCCCGT AGCGCTGATC 
TCGCGCTATC GCCATCAGCG TGACTGGCGC ACCTTGCTGT TACAGGGGGC GGCGTTAACG 
GCGGCGGCGT TGTTGCAGTC GCTGCCCTGG CTTTGGCACG GCAAAGAGTC GTGGAATGCG 
CTGTTGCTGA CTTTAACTGG CGGCCTGACG CTGGCCCCGA TATGTCTGGT GTTCTGGCAC 
TATCTCGCCA ATAACACCTG GCTGCCGCTC GGTCCGTCAC TGGTTTCTCA GCCAATCAAC 
TGGCGCGGGC GACATCTGGT CTGGTACTTG CTGCTGTTTG TTATCAGTCT CTGGCTCCAG 
TTGGGATTGC CGGACGAACT GTCGCGCTTT ACGCCATTCT GTCTGGCGCT GCCGATTATC 
GCGCTGGCCT GGCACTATGG TTGGCAAGGG GCGCTGATTG CGACGTTGAT GAACGCCATC 
GCGCTGATCG CCAGTCAAAC CTGGCGCGAT CATCCGGTGG ATTTATTGCT CTCGCTGCTG 
GTGCAAAGTC TGACAGGGTT GTTGCTTGGC GCTGGCATCC AGCGGTTGCG TGAACTTAAC 
CAGTCGCTGC AAAAGGAACT GGCGCGCAAT CAGCATCTGG CTGAACGGTT GCTGGAAACC 
GAAGAGAGCG TGCGCCGTGA TGTGGCGCGT GAGCTGCATG ATGATATCGG TCAGACCATC 
ACTGCTATTC GTACTCAGGC GGGCATTGTT CAGCGGCTGG CGGCAGATAA CGCCAGCGTG 
AAGCAGAGCG GGCAGCTCAT CGAACAACTA TCGCTGGGCG TTTACGACGC GGTGCGCCGT 
TTGTTGGGTC GGTTACGTCC GCGCCAGTTG GATGATCTCA CCCTGGAGCA GGCCATCCGC 
TCACTGATGC GGGAAATGGA GCTGGAAGGG CGCGGTATTG TCAGCCATCT CGAATGGCGA 
ATCGATGAAT CAGCGTTAAG CGAAAACCAG CGCGTGACGC TGTTTCGTGT CTGCCAGGAA 
GGGCTGAACA ACATTGTGAA ACATGCTGAT GCCAGCGCGG TCACCCTGCA AGGCTGGCAG 
CAGGATGAAC GGTTGATGCT GGTTATTGAA GACGATGGCA GCGGTTTGCC GCCGGGTTCC 
GGGCAACAAG GTTTTGGCCT CACCGGAATG CGCGAGCGCG TAACGGCGCT GGGTGGCACA 
TTACACATTT CCTGTCTGCA CGGCACGCGT GTCAGCGTTT CTCTACCTCA ACGCTATGTC 
TAA

Protein sequence

MKTLFSRLIT VIACFFIFSA AWFCLWSISL HLVERPDMAV LLFPFGLRLG LMLQCPRGYW 
PVLLGAEWLL IYWLTQAVGL THFPLLMIGS LLTLLPVALI SRYRHQRDWR TLLLQGAALT 
AAALLQSLPW LWHGKESWNA LLLTLTGGLT LAPICLVFWH YLANNTWLPL GPSLVSQPIN 
WRGRHLVWYL LLFVISLWLQ LGLPDELSRF TPFCLALPII ALAWHYGWQG ALIATLMNAI 
ALIASQTWRD HPVDLLLSLL VQSLTGLLLG AGIQRLRELN QSLQKELARN QHLAERLLET 
EESVRRDVAR ELHDDIGQTI TAIRTQAGIV QRLAADNASV KQSGQLIEQL SLGVYDAVRR 
LLGRLRPRQL DDLTLEQAIR SLMREMELEG RGIVSHLEWR IDESALSENQ RVTLFRVCQE 
GLNNIVKHAD ASAVTLQGWQ QDERLMLVIE DDGSGLPPGS GQQGFGLTGM RERVTALGGT 
LHISCLHGTR VSVSLPQRYV