Gene SbBS512_E4810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E4810
Symbol
ID	6272207
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	4481822
End bp	4482904
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	36%
IMG OID	641728552
Product	putative type I restriction-modification system specificity subunit
Protein accession	YP_001882947
Protein GI	187731881
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGTTCGG CAATGGTGAA GTTAGGGGAT GTTATTAATG TTCACTACGG AAAAGCATTA 
AAAGCTGATC AGCGTGTATC GAATGGAAGT GTCCATGTTT TTGGTAGTTC AGGAATTGTC 
GGCAACCACG ATAAAACGCT TTGCAGCTAT CCCACGATAA TTATTGGCCG CAAAGGCAGC 
GTTGGTGCTA TTACCTGGGC TCCAAGCGGA GGCTGGATCA TTGATACTGC TTATTACGTT 
GAGATCAAAG ATAATAATAA GTTAGATCTC CGATACTTGT TTTATATTCT GAGCGGAATT 
GATCTCACTA AGAAAACGAT TACCACAAGT ATTCCTGGAT TAAATAGAGA CGATCTCTAT 
GATACATTTA TTAAATTACC ACCTTTTGAA GAGCAGAAAC GAATTGTGGA TCTTCTCGAT 
AAAGCTGAGG GTATACGCCA AAAACGTGAG CAATCCATCA AACTGGCTGA TGATTTTTTG 
CGTGCTACGT TTGCTACAAT GTATGGGAAT CCTATTACAA ACCCCAAAAA ATGGCCTGTC 
CATCTTATGG GAGACATTAT TGAATTTAAA GGTGGAAATC AACCACCTAA AAGTGATTTT 
ATTTTTGAAC CTAAACAGGG TTATATTAGA TTAGTACAAA TTAGAGATTT TAAATCCGAT 
AAATATGCGA CGTACATTCC GCAAGAAAAA GCAAAACGTA TTTTCGAAGT TGATGATGTT 
ATGATTGCTC GTTATGGGCC ACCTGTGTTT CAAATACTTA GAGGTTTATC CGGCAGCTAC 
AATGTAGCTT TAATGAAAGC TTCACCCAAA GAAAATATTA GGAAGGGGTT TATATTCTAT 
CTTCTACAAC TTCCGGAATA TCATGATGTT GTTGTAAAAA ACTCTGAAAG AACAGCAGGA 
CAAACCGGTG TAAATCTTGA ACTATTAAAC AAATTCAATG TTCCCCTCCC ACCTATATAC 
TATCAAGATG AGATATTAGA TAGATTAGCT AGAATTGAAA AATTTAAAGA AAAAATAGAA 
ATATCATTAA ATCATTTAGA AATACAATTT TTATCACTAC AGAAGAGATT AATGGGTTTT 
TAA

Protein sequence

MSSAMVKLGD VINVHYGKAL KADQRVSNGS VHVFGSSGIV GNHDKTLCSY PTIIIGRKGS 
VGAITWAPSG GWIIDTAYYV EIKDNNKLDL RYLFYILSGI DLTKKTITTS IPGLNRDDLY 
DTFIKLPPFE EQKRIVDLLD KAEGIRQKRE QSIKLADDFL RATFATMYGN PITNPKKWPV 
HLMGDIIEFK GGNQPPKSDF IFEPKQGYIR LVQIRDFKSD KYATYIPQEK AKRIFEVDDV 
MIARYGPPVF QILRGLSGSY NVALMKASPK ENIRKGFIFY LLQLPEYHDV VVKNSERTAG 
QTGVNLELLN KFNVPLPPIY YQDEILDRLA RIEKFKEKIE ISLNHLEIQF LSLQKRLMGF