Gene SbBS512_E1555 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E1555
Symbol
ID	6272772
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	1418027
End bp	1419088
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	56%
IMG OID	641725649
Product	hypothetical protein
Protein accession	YP_001880155
Protein GI	187733878
COG category	[S] Function unknown
COG ID	[COG3768] Predicted membrane protein
TIGRFAM ID	[TIGR01620] conserved hypothetical protein, TIGR01620

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGAAC CGTTAAAACC ACGTATTGAT TTCGACGGTC CGCTGGAGGT CGATCAGAAT 
CCAAAATTCA GGGCGCAGCA GACCTTTGAC GAAAATCAGG CGCAAAATTT TGCCCCGGCC 
ACGCTCGATG AAGCGCCTGA AGAAGAGGGG CAAGTTGAAG CGGTAATGGA TGCAGCGTTA 
CGTCCGAAAC GCAGCCTGTG GCGCAAAATG GTGATGGGCG GGCTGGCTCT GTTTGGCGCA 
AGCGTTGTCG GGCAGGGTGT ACAGTGGACA ATGAATGCCT GGCAAACTCA GGACTGGGTG 
GCGCTGGGTG GATGTGCCGC TGGGGCATTG ATTATCGGCG CTGGCGTAGG TTCTGTGGTA 
ACAGAGTGGC GGCGCTTATG GCGCTTGCGA CAGCGCGCCC ATGAACGCGA CGAAGCGCGC 
GATTTGTTGC ACAGCCACGG CACGGGCAAA GGCCGCGCAT TTTGCGAAAA ACTGGCGCAG 
CAGGCGGGTA TTGATCAGTC TCATCCAGCG CTGCAACGCT GGTATGCCTC AATCCATGAA 
ACGCAAAACG ACCGTGAAGT GGTCAGTTTG TATGCGCATT TGGTCCAGCC AGTTTTAGAT 
GCCCAGGCGC GGCGCGAAAT CAGCCGTTCG GCGGCGGAAT CAACGTTGAT GATTGCGGTC 
AGCCCGCTGG CGTTGGTCGA TATGGCGTTT ATCGCCTGGC GCAATCTGCG TTTAATTAAT 
CGCATCGCCA CGCTGTATGG CATTGAACTG GGGTATTACA GCCGTTTGCG TCTGTTTAAG 
CTGGTATTGC TGAATATCGC TTTTGCCGGA GCCAGCGAAC TGGTGCGCGA AGTGGGGATG 
GACTGGATGT CGCAAGATCT CGCTGCTCGT TTGTCTACCC GCGCAGCTCA GGGAATTGGT 
GCTGGACTTC TGACGGCACG ACTCGGGATT AAAGCTATGG AGCTTTGCCG CCCGCTGCCG 
TGGATTGACG ATGACAAACC TCGCCTCGGG GATTTCCGTC GTCAGCTTAT CGGTCAGGTG 
AAAGAAACGC TGCAAAAAGG CAAAACGCCC AGCGAAAAAT AA

Protein sequence

MTEPLKPRID FDGPLEVDQN PKFRAQQTFD ENQAQNFAPA TLDEAPEEEG QVEAVMDAAL 
RPKRSLWRKM VMGGLALFGA SVVGQGVQWT MNAWQTQDWV ALGGCAAGAL IIGAGVGSVV 
TEWRRLWRLR QRAHERDEAR DLLHSHGTGK GRAFCEKLAQ QAGIDQSHPA LQRWYASIHE 
TQNDREVVSL YAHLVQPVLD AQARREISRS AAESTLMIAV SPLALVDMAF IAWRNLRLIN 
RIATLYGIEL GYYSRLRLFK LVLLNIAFAG ASELVREVGM DWMSQDLAAR LSTRAAQGIG 
AGLLTARLGI KAMELCRPLP WIDDDKPRLG DFRRQLIGQV KETLQKGKTP SEK