Gene EcDH1_3990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3990
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	4311147
End bp	4312544
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	54%
IMG OID
Product	histidine kinase
Protein accession	ACX41590
Protein GI	260451168
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTTTTA TGCAACGTTC TAAAGACTCC TTAGCTAAAT GGTTAAGCGC GATCCTCCCC 
GTGGTCATTG TTGGGCTGGT GGGATTGTTT GCGGTAACTG TGATTCGTGA TTATGGGCGG 
GCAAGCGAGG CAGACCGCCA GGCATTACTG GAAAAAGGTA ATGTGCTTAT CCGCGCTCTG 
GAGTCGGGAA GCCGCGTAGG GATGGGGATG CGAATGCACC ATGTACAGCA ACAGGCGCTT 
CTGGAAGAGA TGGCGGGACA GCCGGGAGTG TTGTGGTTCG CAGTCACCGA TGCGCAGGGC 
ATCATTATTC TTCATAGCGA CCCCGATAAG GTCGGGCGTG CGCTCTATTC GCCGGATGAA 
ATGCAGAAAT TAAAGCCAGA GGAAAACTCC CGCTGGCGGC TGCTTGGGAA AACGGAAACT 
ACGCCTGCAC TTGAGGTCTA TCGTTTGTTC CAGCCAATGT CAGCGCCCTG GCGGCATGGA 
ATGCACAATA TGCCGCGCTG TAACGGCAAA GCTGTGCCAC AAGTAGATGC ACAACAGGCT 
ATTTTTATCG CCGTTGATGC CAGTGATCTG GTTGCAACCC AGAGTGGGGA AAAGCGCAAT 
ACCCTGATTA TCCTCTTCGC CCTGGCGACG GTCTTGCTGG CAAGCGTATT GTCATTCTTC 
TGGTATCGCC GCTATCTGCG CTCGCGCCAG CTTCTACAAG ATGAAATGAA GCGCAAAGAG 
AAGCTGGTGG CGCTGGGGCA TCTTGCGGCA GGCGTTGCCC ACGAAATCCG TAACCCACTT 
TCCTCGATTA AAGGACTGGC GAAATACTTT GCCGAGCGCG CGCCTGCAGG GGGAGAAGCG 
CATCAACTGG CGCAGGTGAT GGCGAAAGAG GCCGACCGTT TAAACCGCGT GGTAAGCGAG 
TTGCTGGAAC TGGTTAAGCC AACGCATCTG GCTTTGCAGG CGGTGGATCT CAACACGCTG 
ATTAACCACT CATTACAGCT GGTAAGTCAG GATGCAAACA GCCGGGAGAT CCAGTTACGC 
TTTACCGCCA ACGACACATT ACCGGAAATT CAGGCCGACC CGGACAGGCT GACTCAGGTC 
CTGTTGAATC TCTATCTCAA TGCTATTCAG GCGATTGGTC AGCATGGCGT GATTAGCGTG 
ACGGCCAGCG AAAGCGGCGC GGGCGTGAAA ATCAGCGTTA CCGACAGCGG TAAGGGAATT 
GCGGCAGATC AGCTTGATGC CATCTTCACT CCGTACTTCA CCACTAAAGC CGAAGGCACC 
GGATTGGGGC TGGCGGTCGT GCATAATATT GTTGAACAAC ACGGTGGTAC AATTCAGGTC 
GCAAGCCAGG AGGGAAAAGG CTCAACGTTC ACCCTCTGGC TTCCGGTCAA TATTACGCGT 
AAGGACCCAC AAGGATGA

Protein sequence

MRFMQRSKDS LAKWLSAILP VVIVGLVGLF AVTVIRDYGR ASEADRQALL EKGNVLIRAL 
ESGSRVGMGM RMHHVQQQAL LEEMAGQPGV LWFAVTDAQG IIILHSDPDK VGRALYSPDE 
MQKLKPEENS RWRLLGKTET TPALEVYRLF QPMSAPWRHG MHNMPRCNGK AVPQVDAQQA 
IFIAVDASDL VATQSGEKRN TLIILFALAT VLLASVLSFF WYRRYLRSRQ LLQDEMKRKE 
KLVALGHLAA GVAHEIRNPL SSIKGLAKYF AERAPAGGEA HQLAQVMAKE ADRLNRVVSE 
LLELVKPTHL ALQAVDLNTL INHSLQLVSQ DANSREIQLR FTANDTLPEI QADPDRLTQV 
LLNLYLNAIQ AIGQHGVISV TASESGAGVK ISVTDSGKGI AADQLDAIFT PYFTTKAEGT 
GLGLAVVHNI VEQHGGTIQV ASQEGKGSTF TLWLPVNITR KDPQG