Gene SbBS512_E0587 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E0587
Symbol
ID	6268767
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	560483
End bp	561523
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	54%
IMG OID	641724791
Product	PhoH family protein
Protein accession	YP_001879331
Protein GI	187732299
COG category	[T] Signal transduction mechanisms
COG ID	[COG1702] Phosphate starvation-inducible protein PhoH, predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.139571
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAACATAG ACACTCGCGA AATCACCCTG GAGCCAGCAG ACAACGCGCG TCTGTTGAGC 
CTGTGCGGCC CGTTTGATGA CAACATCAAG CAGCTCGAAC GCCGTCTCGG CATCGAGATC 
AATCGCCGCG ACAACCACTT TAAACTGACC GGCCGTCCGA TTTGCGTCAC CGCTGCGGCA 
GACATTCTGC GTAGCCTGTA TGTCGATACA GCCCCGATGC GCGGTCAGAT TCAGGATATC 
GAACCGGAAC AGATCCACCT TACGATTAAA GAAGCGCGAG TACTGGAGCA AAGTGCGGAG 
AGCGTGCCGG AGTACGGCAA AGCGGTCAAT ATCAAAACCA AACGCGGCGT AATTAAGCCG 
CGCACGCCAA ACCAGGCGCA GTACATCGCC AATATTCTCG ACCATGACAT TACCTTCGGC 
GTTGGCCCGG CGGGTACGGG TAAAACCTAC CTGGCAGTGG CTGCGGCAGT TGATGCCCTG 
GAGCGTCAGG AGATTCGCCG TATTCTGCTG ACTCGTCCGG CGGTCGAAGC CGGTGAGAAA 
CTGGGCTTCC TGCCTGGCGA TTTAAGCCAG AAAGTAGACC CGTATCTGCG CCCACTGTAC 
GACGCGCTGT TTGAAATGCT GGGCTTTGAG AAAGTTGAGA AACTGATTGA GCGCAACGTT 
ATTGAAGTCG CGCCGCTGGC CTATATGCGT GGTCGTACGC TGAACGACGC GTTTATCATT 
CTCGATGAGA GCCAGAACAC CACCATCGAA CAGATGAAGA TGTTCCTGAC CCGTATCGGT 
TTTAACTCAA AAGCGGTTAT CACCGGCGAC GTCACACAGA TCGACCTGCC GCGTAATACT 
AAATCAGGCT TACGTCACGC CATCGAAGTA CTGGCCGATG TCGAAGAGAT CAGCTTTAAC 
TTCTTCCACA GCGAAGACGT GGTTCGTCAC CCTGTGGTGG CGCGTATCGT TAACGCCTAT 
GAAGCCTGGG AAGAAGCCGA ACAAAAACGA AAAGCGGCGC TGGCGGCAGA ACGCAAGCGC 
GAAGAACAGG AACAAAAATG A

Protein sequence

MNIDTREITL EPADNARLLS LCGPFDDNIK QLERRLGIEI NRRDNHFKLT GRPICVTAAA 
DILRSLYVDT APMRGQIQDI EPEQIHLTIK EARVLEQSAE SVPEYGKAVN IKTKRGVIKP 
RTPNQAQYIA NILDHDITFG VGPAGTGKTY LAVAAAVDAL ERQEIRRILL TRPAVEAGEK 
LGFLPGDLSQ KVDPYLRPLY DALFEMLGFE KVEKLIERNV IEVAPLAYMR GRTLNDAFII 
LDESQNTTIE QMKMFLTRIG FNSKAVITGD VTQIDLPRNT KSGLRHAIEV LADVEEISFN 
FFHSEDVVRH PVVARIVNAY EAWEEAEQKR KAALAAERKR EEQEQK