Gene SbBS512_E0228 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E0228
Symbol	dinP
ID	6272955
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	236157
End bp	237221
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	54%
IMG OID	641724476
Product	DNA polymerase IV
Protein accession	YP_001879027
Protein GI	187733383
COG category	[L] Replication, recombination and repair
COG ID	[COG0389] Nucleotidyltransferase/DNA polymerase involved in DNA repair
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.190428
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTATAAGA AAGTGAAGAT TATTCATGTG GATATGGACT GCTTTTTCGC GGCGGTGGAG 
ATGCGCGACA ATCCCGCCCT GCGCGATATC CCTATTGCTA TTGGCGGCAG CCGCGAACGT 
CGGGGGGTGA TCAGTACCGC CAATTATCCC GCGCGTAAAT TTGGCGTACG TAGCGCTATG 
CCGACAGGGA TGGCGCTCAA ATTATGCCCG CATCTCACCT TGCTTCCGGG GCGCTTTGAC 
GCCTACAAAG AAGCCTCAAA TCATATCCGC GAAATCTTCT CGCGCTACAC CTCGCGTATT 
GAACCGTTGT CACTGGATGA GGCTTATCTC GACGTCACCG ATAGCGTCCA TTGCCACGGT 
TCTGCGACCC TCATCGCCCA GGAAATCCGC CAGACGATTT TCAACGAGCT GCAACTGACG 
GCGTCTGCGG GCGTGGCACC CGTAAAGTTT CTCGCCAAAA TCGCCTCCGA CATGAATAAA 
CCCAACGGCC AGTTTGTGAT TACGCCGGCA GAAGTTCCGG CATTTTTACA AACCTTACCA 
CTGGCAAAAA TCCCCGGCGT CGGCAAAGTC TCGGCGGCAA AACTGGAAGC GATGGGGCTA 
CGAACCTGCG GTGATGTACA AAAGTGTGAT CTGGTGATGC TGCTTAAACG CTTTGGCAAA 
TTTGGCCGCA TTTTGTGGGA GCGTAGTCAG GGGATTGACG AGCGCGACGT TAACAGCGAA 
CGGTTGCGAA AATCCGTCGG CGTGGAACGC ACGATGGCGG AAGATATCCA CCACTGGTCT 
GAATGTGAAG CGATTATCGA GCGGCTGTAT CCGGAACTTG AACGCCGTCT GGCAAAGGTG 
AAACCTGATT TACTGATTGC TCGCCAGGGG GTGAAATTAA AGTTTGATGA TTTTCAGCAA 
ACCACTCAGG AGCACGTCTG GCCGCGGCTG AATAAAGCTG ACTTAATCGC CACCGCGCGT 
AAAACCTGGG ATGAACGCCG CGGCGGGCGC GGTGTGCGAC TGGTGGGGCT GCATGTGACG 
TTGCTTGACC CGCAAATGGA AAGACAACTG GTGCTGGGAT TATGA

Protein sequence

MYKKVKIIHV DMDCFFAAVE MRDNPALRDI PIAIGGSRER RGVISTANYP ARKFGVRSAM 
PTGMALKLCP HLTLLPGRFD AYKEASNHIR EIFSRYTSRI EPLSLDEAYL DVTDSVHCHG 
SATLIAQEIR QTIFNELQLT ASAGVAPVKF LAKIASDMNK PNGQFVITPA EVPAFLQTLP 
LAKIPGVGKV SAAKLEAMGL RTCGDVQKCD LVMLLKRFGK FGRILWERSQ GIDERDVNSE 
RLRKSVGVER TMAEDIHHWS ECEAIIERLY PELERRLAKV KPDLLIARQG VKLKFDDFQQ 
TTQEHVWPRL NKADLIATAR KTWDERRGGR GVRLVGLHVT LLDPQMERQL VLGL