Gene SbBS512_E1263 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E1263
Symbol
ID	6270428
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	1156877
End bp	1157926
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	53%
IMG OID	641725384
Product	DNA methylase
Protein accession	YP_001879898
Protein GI	187730991
COG category	[L] Replication, recombination and repair
COG ID	[COG0863] DNA modification methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.00126419
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTAATA CTGTAAAAAT ATCCAGTTGT GAGTTAATCA ACGCCGACTG CCTGGAATTT 
ATCCGGTCGT TACCCGAAAA TTCTGTTGAC CTGATAGTCA CGGACCCGCC GTACTTTAAA 
GTGAAGCCTG AGGGCTGGGA TAACCAGTGG AAGGGCGACG ATGATTACCT GAAGTGGCTG 
GACCAGTGTC TGGCGCAGTT CTGGCGGGTG CTGAAACCTG CCGGAAGTCT TTACCTGTTC 
TGTGGTCATC GCCTGGCATC TGATATCGAA ATCATGATGC GTGAACGCTT CAGTGTGCTG 
AACCATATTA TCTGGGCGAA GCCTTCCGGA CGCTGGAACG GGTGCAACAA GGAAAGCCTG 
CGGGCGTATT TCCCCGCCAC AGAGCGCATT CTGTTCGCGG AACATTATCA GGGGCCGTAT 
CGTCCGAAAG ATGCCGGGTA TGAGGCGAAG GGCAGGGCAC TGAAACAGCA TGTGATGGCC 
CCGCTGATTT CTTACTTTCG TGATGCATGC GCGGCCCTGG GGATAACGGC AAAACAGATT 
GCAGATGCCA CAGGAAAGAA AAACATGGTG TCGCACTGGT TCAGTGCCAG TCAGTGGCAG 
TTGCCGAACG AAAGCGATTA TCTGAAATTA CAGGCACTGT TTGCCAGGGT GGCAGAAGAG 
AAGCATCAGC GGGGGGAACT GGAAAAGCCC CACCACCAGC TGGTGGATAC GTATACTTCA 
CTGAACCGAC AGTATGCGGA GCTGCAGAGT GAATATAAAC ATCTGCGGCG GTATTTTGGT 
GTGACGGCGC AGGTGCCGTA CACGGATGTG TGGACACATA AACCGGTGCA GTTCTATCCC 
GGGAAACATC CGTGCGAAAA ACCGGCAGAA ATGCTGCAGC AGATAATCAG CGCAAGTAGT 
CGTCCTGGTG ATCTGGTTGC GGATTTTTTC ATGGGGTCGG GTTCAACGGT AAAAGCGGCA 
CTGGCGCTCG GGCGTCGTGC GATTGGCGTT GAACTGGAGA CAGGACGTTT TGAGCAGACA 
GTCAGGGAAG TTCAGGATTT AATCGTTTGA

Protein sequence

MLNTVKISSC ELINADCLEF IRSLPENSVD LIVTDPPYFK VKPEGWDNQW KGDDDYLKWL 
DQCLAQFWRV LKPAGSLYLF CGHRLASDIE IMMRERFSVL NHIIWAKPSG RWNGCNKESL 
RAYFPATERI LFAEHYQGPY RPKDAGYEAK GRALKQHVMA PLISYFRDAC AALGITAKQI 
ADATGKKNMV SHWFSASQWQ LPNESDYLKL QALFARVAEE KHQRGELEKP HHQLVDTYTS 
LNRQYAELQS EYKHLRRYFG VTAQVPYTDV WTHKPVQFYP GKHPCEKPAE MLQQIISASS 
RPGDLVADFF MGSGSTVKAA LALGRRAIGV ELETGRFEQT VREVQDLIV