Gene EcolC_3233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3233
Symbol	phoR
ID	6066771
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	3540462
End bp	3541757
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	53%
IMG OID	641602648
Product	phosphate regulon sensor protein
Protein accession	YP_001726182
Protein GI	170021228
COG category	[T] Signal transduction mechanisms
COG ID	[COG5002] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box [TIGR02966] phosphate regulon sensor kinase PhoR

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.62554
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000000115446
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

GTGCTGGAAC GGCTGTCGTG GAAAAGGCTG GTGCTGGAGC TGCTACTTTG CTGCCTCCCG 
GCTTTCATCC TGGGTGCATT TTTTGGTTAC CTGCCCTGGT TTTTGCTGGC ATCGATAACA 
GGACTGCTTA TCTGGCATTT CTGGAATTTA TTGCGCCTTT CATGGTGGCT GTGGGTGGAT 
CGCAGTATGA CCCCGCCACC GGGGCGTGGT AGCTGGGAAC CGCTACTATA CGGCTTACAC 
CAGATGCAGC TGCGAAATAA AAAACGCCGC CGTGAACTGG GCAATCTGAT TAAACGCTTT 
CGTAGCGGCG CGGAGTCGCT GCCCGACGCG GTGGTGCTGA CCACGGAAGA GGGCGGTATT 
TTCTGGTGTA ACGGTCTGGC GCAACAAATT CTTGGTTTGC GCTGGCCGGA AGATAACGGG 
CAGAACATCC TTAACCTACT GCGTTACCCG GAGTTTACGC AATATCTGAA AACGCGTGAT 
TTTTCTCGCC CGCTCAATCT GGTGCTCAAC ACCGGGCGGC ATCTGGAAAT TCGCGTCATG 
CCTTATACCC ACAAACAGTT GCTGATGGTG GCGCGTGATG TCACGCAAAT GCATCAACTG 
GAAGGGGCGC GGCGCAACTT TTTCGCCAAC GTAAGCCATG AGTTACGCAC GCCATTGACC 
GTGTTACAGG GTTACCTGGA GATGATGGAT GAGCAGCCGC TGGAAGGCGC GGTACGCGAA 
AAAGCGTTGC ACACCATGCG CGAGCAGACC CAGCGGATGG AAGGGCTGGT GAAGCAATTG 
CTGACGCTGT CGAAAATTGA AGCCGCGCCG ACGCATTTGC TCAATGAAAA GGTTGATGTG 
CCGATGATGC TGCGCGTTGT TGAGCGCGAG GCTCAGACTC TGAGTCAGAA AAAACAGACA 
TTTACCTTTG AGATAGATAA CGGCCTCAAG GTGTCTGGCA ATGAAGATCA GCTACGCAGT 
GCGATTTCGA ACCTGGTCTA TAACGCCGTG AATCATACGC CGGAAGGCAC GCATATCACC 
GTACGCTGGC AGCGAGTGCC GCACGGTGCC GAATTTAGCG TTGAAGATAA CGGACCGGGC 
ATTGCACCGG AGCATATTCC GCGCCTGACC GAGCGTTTTT ATCGCGTTGA TAAAGCGCGT 
TCCCGGCAAA CCGGCGGTAG CGGATTAGGG TTAGCGATCG TGAAACATGC GGTGAATCAT 
CACGAAAGTC GCCTGAATAT TGAGAGTACA GTAGGAAAAG GAACACGTTT CAGTTTTGTT 
ATCCCGGAAC GTTTAATTGC CAAAAACAGC GATTAA

Protein sequence

MLERLSWKRL VLELLLCCLP AFILGAFFGY LPWFLLASIT GLLIWHFWNL LRLSWWLWVD 
RSMTPPPGRG SWEPLLYGLH QMQLRNKKRR RELGNLIKRF RSGAESLPDA VVLTTEEGGI 
FWCNGLAQQI LGLRWPEDNG QNILNLLRYP EFTQYLKTRD FSRPLNLVLN TGRHLEIRVM 
PYTHKQLLMV ARDVTQMHQL EGARRNFFAN VSHELRTPLT VLQGYLEMMD EQPLEGAVRE 
KALHTMREQT QRMEGLVKQL LTLSKIEAAP THLLNEKVDV PMMLRVVERE AQTLSQKKQT 
FTFEIDNGLK VSGNEDQLRS AISNLVYNAV NHTPEGTHIT VRWQRVPHGA EFSVEDNGPG 
IAPEHIPRLT ERFYRVDKAR SRQTGGSGLG LAIVKHAVNH HESRLNIEST VGKGTRFSFV 
IPERLIAKNS D