Gene SbBS512_E4809 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E4809
Symbol
ID	6270323
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	4480191
End bp	4481825
Gene Length	1635 bp
Protein Length	544 aa
Translation table	11
GC content	51%
IMG OID	641728551
Product	N-6 DNA methylase
Protein accession	YP_001882946
Protein GI	187732102
COG category	[V] Defense mechanisms
COG ID	[COG0286] Type I restriction-modification system methyltransferase subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.136314
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTACTG GCGACTTAAA AAGTAAAATC GACGGACTAT GGGAAGATTT CTGGGTGGGT 
GGTATCACCA ACCCGCTGAC CGTAATCGAA CAGATCACCT ATCTGATGTA TTCCCGGATG 
CTGGATACCC AGGAACAACG CGACGAAAAG CGTAAACAAA TCGCGGGTAT TGATTTTAAA 
CCGCGTTTTG CGCCAGAACA GCAGGAGTTC CGTTTCAGTC ACTATAGCAA CCTTGGCTCG 
GATGAGATGA TGGAAGTGGT GCGCGATGGC GTATTCCAGC ATTTCCGTCA GCTCGGCCAG 
GCCGATGCTT CGAAGGTGAC GCTGCTGGGC AACTTTATGA AAGATGCTCG TCTGGAGATT 
GTTAAGCCGT CATTGCTGAC CAAAGCGGTT GAGGTAATCA AAAACCTGCC ATTGGATCGC 
GGCGACACCA AAGGCGACCT TTACGAATAC CTGTTAAGCA AGCTGACAAC TGCCGGAATC 
AACGGACAGT TCCGCACACC GCGCCACATT ATCCGCACGA TGGTTGAAAT GATGGAGCCG 
AACCCGGCCC GCGGCGAGAC GATTTGCGAT CCCGCCTGTG GCACCGGTGG TTTTCTGGCA 
ACCAGCTATG AATATCTGCT GGAGAAGTAC AGCTCGCTGG AATCCATTCA TACTGAGATT 
GGCACCAACG AACGTGGCGA GCTGGAAGAG CAAAAAATCT TTACCGGCGA TCTGCTGACA 
CCGTGGCGTA ACCATGTGGA TAACAACATG TTCCACGGTT ACGACTTTGA CACCACAATG 
CTACGTATCG CCGCCATGAA CCTGATTATG CACGGCGTGG ATGCGCCTGA TATCCACTAT 
CAGGACACAA TGAGCCAGAG TTTCAGCACA AACTTCCCGC AGGCCAGTAA AAACGCCTTC 
AACCTGATTC TGGCGAACCC GCCGTTTACC GGTTCACTGG ACGAGGAAGA TATCGACTCC 
ACGCTGTCGG CAATGGTGAA AACCAAAAAA ACCGAACTAC TGTTCCTGGC GCGTATTCTG 
CAAATGCTGA AAGTGGGCGG GCGCAGTGCC ACTATCGTGC CGCAGGGCGT GCTGTTTGGC 
TCTAGCAAGG CGCACCAGTC ACTTCGCAAA ACGCTGGTGG AAGATAACCA ACTGGAAGCG 
GTGATCAATC TGCCTTCTGG TGTATTTAAA CCTTACGCTG GCGTGGCGAC GGCGATCTTG 
ATCTTTACCA AAGGCGGTCA AACGGATGAG GTCTGGTTCT ACGATCTACA AAATGACGGC 
TACAGCCTGG ATGATAAGCG CAACCCGATA AAAGACAACG ATCTGCCGCA TCTGCTGGCA 
AGCTGGAAGC ATTACCGTAC TTTACGCGGG CTACCGGTTG ATAACTTTAT GGGTAAGAAG 
TTAGCCTCGT TGCTTAAACA GCAGTACCCG GAAGGGATTA ATGCTGGCGT TGATTTTAAA 
GATCGCACGC AGGCGGCGTT TGTTGTACCG AAAGCGGATA TTGCTGCGCA GAAATACGAT 
CTATCCATCA ACCGTTATAA AGAAGTCGTG TATCAGGCGG AGGAATATGA AGATCCGAAG 
GTGATATTGA AGCGGTTAAA GGATCTGGAA AAAGAGATTC TGGCGGATTT GGATGAGCTG 
GAGGGGATGC TGTGA

Protein sequence

MITGDLKSKI DGLWEDFWVG GITNPLTVIE QITYLMYSRM LDTQEQRDEK RKQIAGIDFK 
PRFAPEQQEF RFSHYSNLGS DEMMEVVRDG VFQHFRQLGQ ADASKVTLLG NFMKDARLEI 
VKPSLLTKAV EVIKNLPLDR GDTKGDLYEY LLSKLTTAGI NGQFRTPRHI IRTMVEMMEP 
NPARGETICD PACGTGGFLA TSYEYLLEKY SSLESIHTEI GTNERGELEE QKIFTGDLLT 
PWRNHVDNNM FHGYDFDTTM LRIAAMNLIM HGVDAPDIHY QDTMSQSFST NFPQASKNAF 
NLILANPPFT GSLDEEDIDS TLSAMVKTKK TELLFLARIL QMLKVGGRSA TIVPQGVLFG 
SSKAHQSLRK TLVEDNQLEA VINLPSGVFK PYAGVATAIL IFTKGGQTDE VWFYDLQNDG 
YSLDDKRNPI KDNDLPHLLA SWKHYRTLRG LPVDNFMGKK LASLLKQQYP EGINAGVDFK 
DRTQAAFVVP KADIAAQKYD LSINRYKEVV YQAEEYEDPK VILKRLKDLE KEILADLDEL 
EGML