Gene EcolC_2474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2474
Symbol
ID	6067606
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2721392
End bp	2722852
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	51%
IMG OID	641601880
Product	sensor protein PhoQ
Protein accession	YP_001725432
Protein GI	170020478
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.701623
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAT TACTGCGTCT TTTTTTCCCG CTCTCGCTGC GGGTACGTTT TCTGTTGGCA 
ACGGCAGCGG TAGTACTGGT GCTTTCGCTT GCCTACGGAA TGGTCGCGCT GATCGGTTAT 
AGCGTCAGTT TCGATAAAAC TACGTTTCGG CTGTTACGTG GCGAAAGCAA TCTGTTCTAT 
ACCCTTGCGA AGTGGGAAAA CAATAAGTTG CATGTCGAGT TACCAGAAAA TATCGACAAG 
CAAAGCCCCA CCATGACGCT AATTTATGAT GAGAACGGGC AGCTTTTATG GGCGCAACGT 
GACGTGCCCT GGCTGATGAA GATGATCCAG CCTGACTGGC TGAAATCGAA TGGTTTTCAT 
GAAATTGAAG CGGATGTTAA CGATACCAGC CTCTTGCTGA GTGGAGATCA TTCGATACAG 
CAACAGTTGC AGGAAGTGCG GGAAGATGAC GACGACGCGG AGATGACCCA CTCGGTGGCA 
GTAAACGTCT ACCCGGCAAC ATCGCGGATG CCAAAATTAA CCATTGTGGT GGTGGATACC 
ATTCCGGTGG AGCTAAAAAG TTCCTATATG GTCTGGAGCT GGTTTATCTA TGTGCTCTCA 
GCCAATCTGC TGTTAGTGAT CCCGCTGCTG TGGGTCGCCG CCTGGTGGAG TTTACGCCCC 
ATCGAAGCCC TGGCAAAAGA AGTCCGCGAA CTGGAAGAAC ATAACCGCGA ATTGCTCAAT 
CCAGCCACAA CGCGAGAACT GACCAGTCTG GTACGAAACC TGAACCGATT GTTAAAAAGT 
GAACGCGAAC GTTACGACAA ATACCGTACG ACGCTCACCG ACCTGACCCA TAGTCTGAAA 
ACGCCACTGG CGGTGCTGCA AAGTACGCTG CGTTCTCTGC GTAGTGAAAA GATGAGCGTC 
AGTGATGCTG AACCGGTAAT GCTGGAGCAA ATCAGCCGCA TTTCACAGCA AATTGGCTAC 
TACCTGCATC GTGCCAGTAT GCGCGGCGGG ACATTGCTTA GCCGCGAGCT GCATCCGGTC 
GCCCCACTGC TGGACAATCT CACCTCGGCG CTGAACAAAG TGTATCAACG CAAAGGGGTC 
AATATCTCTC TCGATATTTC GCCAGAGATC AGCTTTGTCG GTGAGCAGAA CGATTTTGTC 
GAGGTGATGG GCAATCTGCT GGATAATGCC TGTAAATATT GCCTCGAGTT TGTCGAAATT 
TCTGCAAGGC AAACCGACGA GCATCTCTAT ATTGTGGTCG AGGATGATGG ACCCGGTATT 
CCATTAAGCA AGCGAGAGGT CATTTTCGAC CGTGGTCAAC GGGTTGATAC TTTACGCCCT 
GGGCAAGGTG TAGGGCTGGC GGTAGCCCGC GAAATCACCG AGCAATATGA GGGTAAAATC 
GTCGCCGGAG AGAGCATGCT GGGCGGTGCG CGGATGGAGG TGATTTTTGG TCGCCAGCAT 
TCTGCGCCGA AAGATGAATA A

Protein sequence

MKKLLRLFFP LSLRVRFLLA TAAVVLVLSL AYGMVALIGY SVSFDKTTFR LLRGESNLFY 
TLAKWENNKL HVELPENIDK QSPTMTLIYD ENGQLLWAQR DVPWLMKMIQ PDWLKSNGFH 
EIEADVNDTS LLLSGDHSIQ QQLQEVREDD DDAEMTHSVA VNVYPATSRM PKLTIVVVDT 
IPVELKSSYM VWSWFIYVLS ANLLLVIPLL WVAAWWSLRP IEALAKEVRE LEEHNRELLN 
PATTRELTSL VRNLNRLLKS ERERYDKYRT TLTDLTHSLK TPLAVLQSTL RSLRSEKMSV 
SDAEPVMLEQ ISRISQQIGY YLHRASMRGG TLLSRELHPV APLLDNLTSA LNKVYQRKGV 
NISLDISPEI SFVGEQNDFV EVMGNLLDNA CKYCLEFVEI SARQTDEHLY IVVEDDGPGI 
PLSKREVIFD RGQRVDTLRP GQGVGLAVAR EITEQYEGKI VAGESMLGGA RMEVIFGRQH 
SAPKDE