Gene EcolC_0031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0031
Symbol
ID	6068480
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	31230
End bp	32732
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	57%
IMG OID	641599435
Product	sensory histidine kinase UhpB
Protein accession	YP_001723045
Protein GI	170018091
COG category	[T] Signal transduction mechanisms
COG ID	[COG3851] Signal transduction histidine kinase, glucose-6-phosphate specific
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGACGT TGTTCTCCCG CTTAATTACC GTTATTGCCT GCTTTTTTAT CTTCTCTGCC 
GCATGGTTTT GCCTGTGGAG TATCAGCCTG CATCTGGTTG AGCGCCCTGA TATGGCGGTG 
CTGTTATTTC CGTTTGGTCT GCGTCTGGGG CTAATGCTGC AATGCCCGCG CGGATACTGG 
CCGGTGCTGC TGGGCGCGGA GTGGCTGCTG ATTTACTGGC TAACGCAGGC GGTCGGTTTA 
ACCCATTTTC CGTTATTGAT GATCGGTAGT TTACTGACGT TACTGCCCGT AGCGCTGATC 
TCGCGCTATC GCCATCAGCG TGACTGGCGC ACCTTGCTGT TACAGGGGGC GGCGTTAACG 
GCGGCGGCGT TGTTGCAGTC GCTGCCCTGG CTTTGGCACG GCAAAGAGTC GTGGAATGCG 
CTGTTGCTGA CTTTAACTGG CGGCCTGACG CTGGCCCCGA TATGTCTGGT GTTCTGGCAC 
TATCTCGCCA ATAACACCTG GCTGCCGCTC GGCCCGTCAC TGGTTTCTCA GCCAATCAAC 
TGGCGCGGGC GACATCTGGT CTGGTACTTG CTGCTGTTTG TTATCAGTCT CTGGCTCCAG 
TTGGGATTGC CGGACGAACT GTCGCGCTTT ACGCCATTCT GTCTGGCGCT GCCGATTATC 
GCGCTGGCCT GGCACTATGG TTGGCAAGGG GCGCTGATTG CGACGTTGAT GAACGCCATC 
GCGCTGATCG CCAGTCAAAC CTGGCGCGAT CATCCGGTGG ATTTATTGCT CTCGCTGCTG 
GTGCAAAGTC TGACAGGGTT GTTGCTTGGC GCTGGCATCC AGCGGTTGCG TGAACTTAAC 
CAGTCGCTGC AAAAGGAACT GGCGCGCAAT CAGCATCTGG CTGAACGGTT GCTGGAAACC 
GAAGAGAGCG TGCGCCGTGA TGTGGCGCGT GAGCTGCATG ATGATATCGG TCAGACCATC 
ACTGCTATTC GTACTCAGGC GGGCATTGTT CAGCGGCTGG CGGCAGATAA CGCCAGCGTG 
AAGCAGAGCG GGCAGCTCAT CGAACAACTA TCGCTGGGCG TTTACGACGC GGTGCGCCGT 
TTGTTGGGTC GGTTACGTCC GCGCCAGTTG GATGATCTCA CCCTGGAGCA GGCCATCCGC 
TCACTGATGC GGGAAATGGA GCTGGAAGGG CGCGGTATTG TCAGCCATCT CGAATGGCGA 
ATCGATGAAT CAGCGTTAAG CGAAAACCAG CGCGTGACGC TGTTTCGTGT CTGCCAGGAA 
GGGCTGAACA ACATTGTGAA ACATGCTGAT GCCAGCGCGG TCACCCTGCA AGGCTGGCAG 
CAGGATGAAC GGTTGATGCT GGTTATTGAA GACGATGGCA GCGGTTTGCC GCCGGGTTCC 
GGGCAACAAG GTTTTGGCCT CACCGGAATG CGCGAGCGCG TAACGGCGCT GGGTGGCACA 
TTACACATTT CCTGTCTGCA CGGCACGCGT GTCAGCGTTT CTCTACCTCA ACGTTATGTC 
TAA

Protein sequence

MKTLFSRLIT VIACFFIFSA AWFCLWSISL HLVERPDMAV LLFPFGLRLG LMLQCPRGYW 
PVLLGAEWLL IYWLTQAVGL THFPLLMIGS LLTLLPVALI SRYRHQRDWR TLLLQGAALT 
AAALLQSLPW LWHGKESWNA LLLTLTGGLT LAPICLVFWH YLANNTWLPL GPSLVSQPIN 
WRGRHLVWYL LLFVISLWLQ LGLPDELSRF TPFCLALPII ALAWHYGWQG ALIATLMNAI 
ALIASQTWRD HPVDLLLSLL VQSLTGLLLG AGIQRLRELN QSLQKELARN QHLAERLLET 
EESVRRDVAR ELHDDIGQTI TAIRTQAGIV QRLAADNASV KQSGQLIEQL SLGVYDAVRR 
LLGRLRPRQL DDLTLEQAIR SLMREMELEG RGIVSHLEWR IDESALSENQ RVTLFRVCQE 
GLNNIVKHAD ASAVTLQGWQ QDERLMLVIE DDGSGLPPGS GQQGFGLTGM RERVTALGGT 
LHISCLHGTR VSVSLPQRYV