Gene SbBS512_E1452 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E1452
Symbol
ID	6270669
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	1325232
End bp	1326299
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	41%
IMG OID	641725553
Product	hypothetical protein
Protein accession	YP_001880059
Protein GI	187732391
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCAAC ATCAATATTA TCCACAGCTG AAATGGAAGC CTGCTGAATA TGAATCTCTG 
ATGCTTTTAG ATCAAACTAC GCTCTCTGGT TTTACTCCGA TCATTACCAT TCCAGACATA 
GACTGGGATT ATGAAAACGA ATGCTACAAG AAGAATTTGA GTTCTTACTT ATCTGACTTC 
GGTATTAACC TTGCGGCATC CTGGAAAGCC AATCGTCCTG TTTTGCTGGA TGTTAAATAT 
TTAGATAAAC ATGGTTCGAG CCGCCATCAT CCTCTAGATA TGTGTATCCA AGATGCTAGA 
GTAAATGGTA AGGAAATTAT CCCTGTTGTT TCTCCCGCAT ATTCAACAAA CTATATACAT 
GCTGTTCAAC GCAACTTAAT CAATGGGCTC GCTATATCTA TCACCCCCCA GACATGGCAC 
CAATTCACAA GTCTGGTTAA CCACTTAAAT ATTCATCCTA GTTTAATTGA TGTAATCATT 
GATTTTGGAG ATATTCAAAA CGCAACTGAT AGTTTAAAAC AACAAGCATT AAGCATGGTC 
AACACATTAT CAGGCCAAGC TCCGTGGAGA AACTTGATTT TATCTTCAAC CGCATACCCG 
GCATCACAGG CAGGGATACC GCAACATCAA GTTCATCATA TTCCGCGCCA TGAATACGAT 
CTTTGGATGT ACGTAGTACA GAATTTTAGC AATGGAAGAA CGCCAAGTTT TAGTGATTAT 
CCCACCGCTA GCTCTACCAT TACGAGCGTA GACCCACGCT TCATGTCTCA GTATGTCTCA 
GTGAGATATT CGAACGATAC CTCATGGATC TTTGTAAAAG GTACCGCAGT TAAAGGAAAT 
GGATGGGGCC AAACTAAAAA CTTATGTACT ACCCTTGTTA GTTCGCCAGA GTATCAAGTC 
TTTGGCTCCA AATTTAGTTG GGGGGATGAT TACATTTACC AAAGATCATT AGGCGCTAAC 
AAATCTGGCG GCTCTAAAGA ATGGCGTAAA GTTGCACATA CGCACCATAT TACGTTAGTC 
GTGAGACAGC TTTATTGGTT GGCGCAGACT CAGCCTGCCA AGCCTTAA

Protein sequence

MSQHQYYPQL KWKPAEYESL MLLDQTTLSG FTPIITIPDI DWDYENECYK KNLSSYLSDF 
GINLAASWKA NRPVLLDVKY LDKHGSSRHH PLDMCIQDAR VNGKEIIPVV SPAYSTNYIH 
AVQRNLINGL AISITPQTWH QFTSLVNHLN IHPSLIDVII DFGDIQNATD SLKQQALSMV 
NTLSGQAPWR NLILSSTAYP ASQAGIPQHQ VHHIPRHEYD LWMYVVQNFS NGRTPSFSDY 
PTASSTITSV DPRFMSQYVS VRYSNDTSWI FVKGTAVKGN GWGQTKNLCT TLVSSPEYQV 
FGSKFSWGDD YIYQRSLGAN KSGGSKEWRK VAHTHHITLV VRQLYWLAQT QPAKP