Gene EcSMS35_4452 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4452
Symbol	zraS
ID	6143174
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4546451
End bp	4547827
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	55%
IMG OID	641619272
Product	sensor protein ZraS
Protein accession	YP_001746388
Protein GI	170683574
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.260374
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.000970682
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGTTTTA TGCAACGTTC TAAAGACTCC TTAGCTAAAT GGTTAAGCGC GATCCTCCCC 
GTGGTCATTG TTGGGCTGGT GGGGCTGTTT GCGGTGACAG TGATTCGCGA TTATGGGCGC 
GAGACTGCCG CCGCCAGACA AACGCTGCTG GAAAAAGGCA GTGTACTTAT CCGTGCTCTC 
GAATCCGGCT CGCGCGTCGG CATGGGGATG CGCATGCATC ATGCGCAGCA GCAGGCATTA 
CTGGAAGAAA TGGCCGGGCA GCCTGGTGTA CGTTGGTTTG CGGTCACGGA TGAACAAGGA 
ACAATCGTGA TGCATAGCAA CTCCGGCATG GTGGGAAAAC AGCTTTATTC CCCGCAGGAA 
ATGCAGCAGT TACATCCGGG AGATGAAGAA GCGTGGCGGC GGATCGATAG CGCAGACGGC 
GAGCCTGTTC TGGAAATTTA TCGCCAGTTT CAACCGATGT TTGCTGCTGG AATGCACCGG 
ATGCGCCATA TGCAGCAATA TGCCGCGACA CCACAAGCAA TTTTCATTGC TTTCGACGCC 
AGTAACATTG TGAGTGCCGA AGATCGTGAG CAGAGAAACA CCCTGATTAT CCTCTTCGCC 
CTGGCGACGG TCTTGCTGGC AAGCGTGTTG TCATTCTTCT GGTATCGTCG CTATCTGCGC 
TCGCGCCAGT TGTTGCAGGA TGAAATGAAG CGCAAAGAGA AGCTGGTGGC GCTGGGGCAC 
CTTGCGGCAG GTGTTGCCCA CGAAATCCGT AACCCACTTT CCTCGATTAA AGGGCTGGCG 
AAATACTTTG CCGAACGCGC GCCAGCAGGG GGAGAAGCGC ATCAACTGGC GCAGGTGATG 
GCGAAAGAAG CCGACCGTTT AAACCGCGTG GTAAGCGAGT TGCTGGAACT GGTTAAGCCA 
ACGCATCTGG CTTTGCAGGC GGTGGATCTC AACACGCTGA TTAACCACTC ATTACAGCTG 
GTAAGCCAGG ATGCAAACAG CCGGGAGATC CAGTTACGCT TTACCGCCAA CGACACATTA 
CCGGAAATTC AGGCCGATCC GGACAGGCTG ACTCAGGTCC TGTTGAATCT CTATCTCAAT 
GCTATTCAGG CGATTGGTCA GCATGGCGTG ATTAGCGTGA CGGCCAGCGA AAGCGGCACG 
GGTGTGAAAA TCAGCGTTAC CGACAGCGGT AAGGGAATTG CGGCAGATCA GCTTGAAGCC 
ATCTTCACCC CGTACTTCAC CACCAAAGCC GAAGGCACCG GACTGGGGCT GGCGGTCGTG 
CATAATATTG TTGAACAACA CGGTGGTACA ATTCAGGTCG CAAGCCAGGA GGGAAAAGGC 
GCAACGTTCA CCCTCTGGCT TCCGGTCAAT ATTACGCGTA AGGACCCACA AGGATGA

Protein sequence

MRFMQRSKDS LAKWLSAILP VVIVGLVGLF AVTVIRDYGR ETAAARQTLL EKGSVLIRAL 
ESGSRVGMGM RMHHAQQQAL LEEMAGQPGV RWFAVTDEQG TIVMHSNSGM VGKQLYSPQE 
MQQLHPGDEE AWRRIDSADG EPVLEIYRQF QPMFAAGMHR MRHMQQYAAT PQAIFIAFDA 
SNIVSAEDRE QRNTLIILFA LATVLLASVL SFFWYRRYLR SRQLLQDEMK RKEKLVALGH 
LAAGVAHEIR NPLSSIKGLA KYFAERAPAG GEAHQLAQVM AKEADRLNRV VSELLELVKP 
THLALQAVDL NTLINHSLQL VSQDANSREI QLRFTANDTL PEIQADPDRL TQVLLNLYLN 
AIQAIGQHGV ISVTASESGT GVKISVTDSG KGIAADQLEA IFTPYFTTKA EGTGLGLAVV 
HNIVEQHGGT IQVASQEGKG ATFTLWLPVN ITRKDPQG