Gene SbBS512_E4495 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E4495
Symbol	zraS
ID	6272252
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	4202783
End bp	4204159
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	54%
IMG OID	641728287
Product	sensor protein ZraS
Protein accession	YP_001882689
Protein GI	187732012
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.000791685
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTTTTA TGCAACGTTC TAAAGACTCC TTAGCTAAAT GGTTAAGCGC GATCCTCCCC 
GTGGTCATTG TTGGGCTGGT AGGGTTGTTT GCGGTGACGG TGATTCGCGA TTATGGGCGC 
GAGACTGCCG CCGCCAGACA AACGCTGCTG GAAAAAGGCA GTGTACTTAT TCGCGCTCTT 
GAATCCGGCT CGCGCGTCGG CATGGGGATG CGCATGCATC ATGCGCAGCA GCAGGCCTTA 
CTGGAAGAAA TGGCCGGGCA GCCTGGAGTA CGTTGGTTTG CGGTCACGGA TGAACAAGGA 
ACAATCGTGA TGCATAGCAA CTCCGGCATG GTGGGAAAAC AGATTTATTC CCCGCAGGAA 
ATGCAGCAGT TACATCCGGG AGATGAAGAA GCGTGGCGGC GGATCGATAG CGCAGACGGT 
GAGCCTGTTC TGGAAATTTA TCGCCAGTTT CAACCGATGT TTGGTGCTGG AATGCACCGG 
ATGCGCCATA TGCAGCAGTA TGCCGCGACA CCACAAGCAA TTTTCATCGC TTTCGACGCC 
AGTAATATTG TGAGTGCCGA AGATCGTGAG CAGAGAAACA CCCTGATTAT CCTCTTCGCC 
CTGGCGACGG TCTTGCTGGC AAGCGTATTG TCATTCTTCT GGTATCGCCG CTATCTGCGC 
TCGCGCCAGC TTCTACAAGA TGAAATGAAG CGCAAAGAGA AGCTGGTGGC ACTGGGGCAT 
CTGGCGGCAG GCGTTGCCCA CGAAATCCGT AATCCACTTT CCTCAATTAA AGGGCTGGCG 
AAATACTTTG CCGAACGCGC GCCAGCAGGG GGAGAAGCGC ATCAACTGGC GCAGGTGATG 
GCGAAAGAAG CCGACCGTTT AAACCGCGTG GTAAGCGAGT TGCTGGAACT GGTTAAGCCA 
ACGCATCTGG CTTTGCAGGC GGTGGATCTC AACACGCTGA TTAACCACTC ATTACAGCTG 
GTAAGCCAGG ATGCAAACAG CCGGGAGATC CAGTTACGCT TTACCGCCAA CGACACATTA 
CCGGAAATTC AGGCCGATCC GGACAGGCTG ACTCAGGTCC TGTTGAATCT CTATCTCAAT 
GCTATTCAGG CGATTGTTCA GCATGGCGTG ATTAGCGTGA CGGTCAGCGA AAGCGGCGCG 
GGCGTGAAAA TCAGCGTTAC CGACAGCGGT AAGGGAATTG CGGCAGATCA GCTTGAAGCC 
ATCTTCACTC CGTACTTCAC CACCAAAGCC GAAGGCACCG GATTGGGGCT GGCGGTCGTG 
CATAATATTG TTGAACAACA CGGTGGTACA ATTCAGGTCG CAAGCCAGGA GGGAAAAGGC 
TCAACGTTCA CCCTCTGGCT TCCGGTCAAT ATTACGCGTA AGGACCCACA AGGATGA

Protein sequence

MRFMQRSKDS LAKWLSAILP VVIVGLVGLF AVTVIRDYGR ETAAARQTLL EKGSVLIRAL 
ESGSRVGMGM RMHHAQQQAL LEEMAGQPGV RWFAVTDEQG TIVMHSNSGM VGKQIYSPQE 
MQQLHPGDEE AWRRIDSADG EPVLEIYRQF QPMFGAGMHR MRHMQQYAAT PQAIFIAFDA 
SNIVSAEDRE QRNTLIILFA LATVLLASVL SFFWYRRYLR SRQLLQDEMK RKEKLVALGH 
LAAGVAHEIR NPLSSIKGLA KYFAERAPAG GEAHQLAQVM AKEADRLNRV VSELLELVKP 
THLALQAVDL NTLINHSLQL VSQDANSREI QLRFTANDTL PEIQADPDRL TQVLLNLYLN 
AIQAIVQHGV ISVTVSESGA GVKISVTDSG KGIAADQLEA IFTPYFTTKA EGTGLGLAVV 
HNIVEQHGGT IQVASQEGKG STFTLWLPVN ITRKDPQG