Gene SbBS512_E3765 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E3765
Symbol	damX
ID	6270480
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	3490279
End bp	3491565
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	54%
IMG OID	641727628
Product	hypothetical protein
Protein accession	YP_001882063
Protein GI	187731317
COG category	[S] Function unknown
COG ID	[COG3266] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.00105538
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATGAAT TCAAACCAGA AGACGAGCTG AAACCCGATC CCAGCGATCG TCGTACTGGT 
CGTTCTCGTC AATCTTCTGA ACGTTCTGAG CGTACTGAAC GTGGCGAACC GCAGATCAAT 
TTTGATGATA TTGAACTTGA TGACACTGAC GATCGCCGTC CGACTCGTGC GCAAAAAGAG 
CGCAATGAGG AACCGGAAAT CGAAGAAGAA ATTGACGAAT CCGAAGATGA AACCGTGGAT 
GAAGAGCGCG TAGAGCGTCG TCCGCGTAAG TGCAAAAAAG CAGCCAGTAA ACCCGCTTCT 
CGTCAGTATA TGATGATGGG CGTCGGCATT CTGGTTCTAC TGCTGTTGAT CATCGGTATC 
GGTTCTGCGC TAAAAGCCCC CTCGACCTCT TCCAGCGATC AAACCGCGTC TGGCGAGAAG 
AGTATTGATC TTGCAGGCAA TGCGACCGAT CAGGCGAATG GGGTGCAGCC AGCGCCGGGA 
ACCACGTCTG CGGAAAATAC TCAGCAGGAT GTTTCTCTGC CACCGATCTC TTCTACGCCG 
ACTCAAGGGC AAACCCCGGC GGCAACGGAT GGTCAACAAC GTGTTGAAGT GCAGGGTGAC 
CTGAACAATG CGCTGACTCA GCCACAAAAT CAGCAACAGT TGAACAATGT GGCGGTCAAT 
TCCACATTGC CGACCGAACC AGCGACTGTC GCGCCTGTTC GCAATGGCAA TGCATCGCGT 
GACACGGCGA AAACGCAAAC CGCTGAACGT CCGTCCACTA CGCGCCTAGC TCGTCAGCAG 
GCGGTGATTG AACCGAAAAA ACCGCAAGCA ACCGTGAAAA CGGAGCCGAA GCCGGTAGCA 
CAGACGCCGA AGCGTACTGA ACCAGCTGCC CCTGTGGCGA GCACGAAGGC ACCGGCTGCG 
ACTTCTACGC CAGCACCAAA AGAGACGGCG ACTACGGCTC CAGTACAGAC GGCATCCCCG 
GCGCAAACCA CGGCAACACC AGCCGCTGGA GGGAAGACCG CAGGTAATGT TGGTTCGTTG 
AAATCGGCAC CGTCCAGCCA TTACACTCTG CAGCTGAGCA GTTCCTCTAA CTACGACAAC 
CTGAACGGTT GGGCGAAGAA AGAGAATCTG AAAAACTACG TTGTCTATGA AACGACGCGT 
AATGGTCAGC CGTGGTATGT CCTGGTTTCT GGCGTGTACG CTTCGAAAGA AGAGGCGAAA 
AAAGCGGTAT CTACATTGCC AGCAGATGTT CAGGCCAAAA ACCCGTGGGC GAAACCGCTG 
CGTCAGGTAC AGGCCGATCT GAAGTAA

Protein sequence

MDEFKPEDEL KPDPSDRRTG RSRQSSERSE RTERGEPQIN FDDIELDDTD DRRPTRAQKE 
RNEEPEIEEE IDESEDETVD EERVERRPRK CKKAASKPAS RQYMMMGVGI LVLLLLIIGI 
GSALKAPSTS SSDQTASGEK SIDLAGNATD QANGVQPAPG TTSAENTQQD VSLPPISSTP 
TQGQTPAATD GQQRVEVQGD LNNALTQPQN QQQLNNVAVN STLPTEPATV APVRNGNASR 
DTAKTQTAER PSTTRLARQQ AVIEPKKPQA TVKTEPKPVA QTPKRTEPAA PVASTKAPAA 
TSTPAPKETA TTAPVQTASP AQTTATPAAG GKTAGNVGSL KSAPSSHYTL QLSSSSNYDN 
LNGWAKKENL KNYVVYETTR NGQPWYVLVS GVYASKEEAK KAVSTLPADV QAKNPWAKPL 
RQVQADLK