Gene SbBS512_E2196 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E2196
Symbol
ID	6270201
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	1994741
End bp	1995916
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	53%
IMG OID	641726221
Product	DNA methylase
Protein accession	YP_001880706
Protein GI	187732924
COG category	[L] Replication, recombination and repair
COG ID	[COG0863] DNA modification methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00000000872225
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGTACGCC GTCTGCGTTT CTCCGGTCCT AAGACATCAA TCATCTGTAC TCCAATGACT 
AGTCTAAAAA CTAGTATTAA GACTATCACT TATTTAAGTG ATACTGGTTG TCTGGAGATT 
CAGGGGGCCA GTCTAATCAG TAAGTTGGAG TCATTACCCG CCGACTGCCT GGAATTTATC 
TGGTCGTTAC CCGAAAATTC TGTTGACCTG ATAGTCACGG ACCCGCCGTA CTTTAAAGTG 
AAGCCTGAGG GCTGGGATAA CCAGTGGAAG GGCGACGATG ATTACCTGAA GTGGCTGGAC 
CAGTGTCTGG CGCAGTTCTG GCGGGTGCTG AAACCTGCCG GAAGTCTTTA CCTGTTCTGT 
GGTCATCGCC TGGCATCTGA TATCGAAATC ATGATGCGTG AACGCTTCAG TGTGCTGAAC 
CATATTATCT GGGCGAAGCC GTCCGGACGC TGGAACGGAT GCAACAAGGA AAGCCTGCGG 
GCGTATTTCC CCGCCACAGA GCGCATTCTG TTCGCGGAAC ATTATCAGGG GCCGTATCGT 
CCGAAAGATG CCGGGTATGC GGCGAAGGGC AGTGCACTGA AACAGCATGT GATGGCCCCG 
CTGATTTCTT ACTTTCGTGA TGCGCGAGCT GCCCTGGGGA TAACGGCAAA ACAGATTGCA 
GATGCCACAG GAAAGAAAAA CATGGTGTCG CACTGGTTCA GTGCCAGTCA GTGGCAGTTG 
CCGAATGAAA GCGATTATCT GAAATTACAG GCGCTGTTTG CCCGGGTGGC AGAAGAGAAG 
CATCGGCGTG GTGAACTGGA AAAGCTCCAC CACCAGCTGG TGGATACGTA TACCTCACTG 
AACCGGCAGT ATGCGGAGCT GCTGAGTGAA TATAAACATC TGCGGCGGTA TTTTGGCGTG 
ACGGTGCAGG TGCCGTATAC CGATGTGTGG ACGCATAAAC CGGTGCAGTT CTATCCCGGG 
AAACATCCGT GCGAAAAACC GGCAGAAATG CTGCAGCAGA TAATCAGCGC TGGCAGTCGT 
CCGGGTGACC TGATTGCAGA TTTTTTCATG GGGTCGGGTT CGACAGTGAA AGCGGCACTG 
GCGCTCGGGC GTCGTGCAAT TGGCGTTGAG CTGGAGACTG AACGTTTTGA GCAGACGGTT 
CGGGAAGTAC AGGATTTAGT CAGCCAGAAC GGATGA

Protein sequence

MVRRLRFSGP KTSIICTPMT SLKTSIKTIT YLSDTGCLEI QGASLISKLE SLPADCLEFI 
WSLPENSVDL IVTDPPYFKV KPEGWDNQWK GDDDYLKWLD QCLAQFWRVL KPAGSLYLFC 
GHRLASDIEI MMRERFSVLN HIIWAKPSGR WNGCNKESLR AYFPATERIL FAEHYQGPYR 
PKDAGYAAKG SALKQHVMAP LISYFRDARA ALGITAKQIA DATGKKNMVS HWFSASQWQL 
PNESDYLKLQ ALFARVAEEK HRRGELEKLH HQLVDTYTSL NRQYAELLSE YKHLRRYFGV 
TVQVPYTDVW THKPVQFYPG KHPCEKPAEM LQQIISAGSR PGDLIADFFM GSGSTVKAAL 
ALGRRAIGVE LETERFEQTV REVQDLVSQN G