Gene SbBS512_E1150 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E1150
Symbol
ID	6270088
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	1042688
End bp	1044049
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	54%
IMG OID	641725280
Product	peptidase, U32 family
Protein accession	YP_001879797
Protein GI	187733327
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.565411
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTAAAC CGGAACTCCT TTCCCCGGCG GGAACGCTGA AAAATATGCG TTACGCTTTC 
GCTTATGGCG CAGATGCTGT TTATGCGGGC CAGCCGCGTT ATTCCCTGCG TGTGCGCAAC 
AACGAATTCA ACCACGAAAA TCTTCAGCTC GGCATCAATG AAGCCCACGC GCTGGGGAAA 
AAGTTTTATG TCGTGGTCAA CATTGCACCG CACAACGCCA AGCTGAAAAC CTTTATCCGT 
GACCTGAAAC CGGTGGTGGA AATGGGGCCG GATGCGCTGA TTATGTCCGA TCCAGGGCTG 
ATTATGCTGG TGCGTGAGCA CTTCCCTGAA ATGCCGATCC ACCTTTCGGT GCAGGCTAAC 
GCCGTGAACT GGGCGACGGT GAAATTCTGG CAGCAAATGG GCCTGACCCG CGTGATCCTC 
TCTCGCGAGC TGTCGCTGGA AGAGATTGAA GAGATCCGCA ATCAGGTGCC GGATATGGAG 
ATCGAGATCT TCGTTCACGG CGCGCTGTGC ATGGCCTACT CCGGTCGCTG CCTGCTCTCT 
GGCTATATCA ACAAGCGCGA CCCGAACCAG GGCACCTGCA CCAACGCCTG CCGCTGGGAG 
TACAACGTCC AGGAAGGGAA AGAAGATGAT GTTGGCAACA TCGTACACAA GTACGAGCCG 
ATTCCGGTGC AAAATGTTGA GCCGACGCTG GGTATCGGCG CACCAACCGA CAAAGTGTTT 
ATGATCGAAG AGGCCCAGCG TCCGGGCGAG TATATGACCG CGTTTGAAGA TGAGCACGGC 
ACTTACATCA TGAACTCGAA AGATCTGCGC GCCATCGCCC ATGTAGAACG CCTGACCAAA 
ATGGGCGTGC ATTCGCTGAA AATCGAAGGT CGTACCAAAT CTTTCTACTA TTGTGCACGC 
ACCGCACAGG TTTACCGCAA AGCTATCGAT GACGCCGCTG CGGGAAAACC GTTCGATACC 
AGCCTGCTGG AAACTCTGGA AGGTCTGGCG CATCGTGGCT ATACCGAAGG TTTCCTGCGT 
CGTCATACTC ACGACGATTA TCAGAACTAC GAATACGGTT ATTCAGTTTC TGACCGCCAG 
CAGTTTGTTG GTGAGTTTAC CGGTGAGCGC AAGGGGGACC TCGCGGCGGT AGCGGTGAAA 
AATAAATTCT CCGTTGGCGA CAGCCTTGAG CTGATGACGC CGCAAGGCAA CATTAATTTT 
ACCCTTGAGC ACATGGAAAA CGCCAAAGGC GAAGCTATGC CGATAGCACC AGGCGATGGT 
TATACTGTGT GGCTCCCGGT CCCGCAGGAT CTTGAGCTCA ATTACGCGCT GCTGATGCGT 
AATTTCTCCG GGGAAACCAC GCGTAATCCC CACGGTAAGT GA

Protein sequence

MFKPELLSPA GTLKNMRYAF AYGADAVYAG QPRYSLRVRN NEFNHENLQL GINEAHALGK 
KFYVVVNIAP HNAKLKTFIR DLKPVVEMGP DALIMSDPGL IMLVREHFPE MPIHLSVQAN 
AVNWATVKFW QQMGLTRVIL SRELSLEEIE EIRNQVPDME IEIFVHGALC MAYSGRCLLS 
GYINKRDPNQ GTCTNACRWE YNVQEGKEDD VGNIVHKYEP IPVQNVEPTL GIGAPTDKVF 
MIEEAQRPGE YMTAFEDEHG TYIMNSKDLR AIAHVERLTK MGVHSLKIEG RTKSFYYCAR 
TAQVYRKAID DAAAGKPFDT SLLETLEGLA HRGYTEGFLR RHTHDDYQNY EYGYSVSDRQ 
QFVGEFTGER KGDLAAVAVK NKFSVGDSLE LMTPQGNINF TLEHMENAKG EAMPIAPGDG 
YTVWLPVPQD LELNYALLMR NFSGETTRNP HGK