Gene SbBS512_E2453 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E2453
Symbol
ID	6269581
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	2254623
End bp	2255615
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	50%
IMG OID	641726444
Product	hypothetical protein
Protein accession	YP_001880925
Protein GI	187732914
COG category	[S] Function unknown
COG ID	[COG2990] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.0233718
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTGAAAT CGACGTCATG TATAACCATT GATTTCATGA ATATGTCGCA GCTAACTGAA 
CGGACCTTTA CGCCATCTGA ATCTCTCAGC AGCCTGTCAC TTTTTCTTAG TCTGGCACGT 
GGACAGTGTC GGCCGGGTAA ATTCTGGCAT CGCCGTAGTT TTCGCCAGAA ATTTTTGCTG 
CGCTCGTTGA TTATGCCGCG TTTAAGCGTT GAGTGGATGA ACGAACTTTC CCACTGGCCT 
AATCTCAATG TGTTGTTAAC GCGCCAGCCG CGACTGCCTG TGCGTCTGCA TCGCCCTTAC 
CTTGCGGCGA ATCTTAGCCG TAAGCAATTG CTGGAGGCGT TACGTTACCA TTATGCGTTA 
CTCCGCGGAT GTATGTCGGC GGAAGAATTC AGCTTATATT TGAATACCCC CGGGCTGCAA 
CTGGCGAAGC TGGAAGGCAA AAACGGCGAG CAGTTCACGC TTGAGCTGAC CATGATGATC 
TCAATGGATA AAGAAGGTGA CAGCACAATC CTGTTTCGCA ACAGCGAAGG TATTCCTCTG 
GCAGAGATCA CGTTTACCCT GTGTGAATAT CAGGGGAAAA GAACGATGTT TATTGGCGGA 
CTGCAAGGCG CAAAATGGGA AATTCCACAT CAGGAAATCC AGAATGCGAC GAAAGCCTGC 
CACGGGCTAT TTCCCAAACG CCTCGTGATG GAAGCGGCCT GTCTGTTTGC CCAACGTTTG 
CAGGTAGAGC AGATTATTGC CGTCAGCAAT GAAACGCATA TTTACCGCAG CCTGCGTTAT 
CGCGATAAAG AAGGCAAGAT CCACGCTGAT TACAACGCTT TCTGGGAATC GGTTGGCGGC 
GTATGTGATG CTGAACGCCA TTACCGCCTT CCAGCACAGA TAGCACGAAA AGAGATTGCC 
GAAATCGCCA GTAAAAAACG GGCTGAATAC CGTCGGCGCT ATGAGATGCT CGACGCTATT 
CAGCCACAAA TGGCCACGAT GTTTCGCGGT TAA

Protein sequence

MVKSTSCITI DFMNMSQLTE RTFTPSESLS SLSLFLSLAR GQCRPGKFWH RRSFRQKFLL 
RSLIMPRLSV EWMNELSHWP NLNVLLTRQP RLPVRLHRPY LAANLSRKQL LEALRYHYAL 
LRGCMSAEEF SLYLNTPGLQ LAKLEGKNGE QFTLELTMMI SMDKEGDSTI LFRNSEGIPL 
AEITFTLCEY QGKRTMFIGG LQGAKWEIPH QEIQNATKAC HGLFPKRLVM EAACLFAQRL 
QVEQIIAVSN ETHIYRSLRY RDKEGKIHAD YNAFWESVGG VCDAERHYRL PAQIARKEIA 
EIASKKRAEY RRRYEMLDAI QPQMATMFRG