Gene SbBS512_E0824 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E0824
Symbol
ID	6270835
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	773033
End bp	774268
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	51%
IMG OID	641724997
Product	dihydropyrimidine dehydrogenase
Protein accession	YP_001879524
Protein GI	187733441
COG category	[C] Energy production and conversion [F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase [COG4231] Indolepyruvate ferredoxin oxidoreductase, alpha and beta subunits
TIGRFAM ID	[TIGR01037] dihydroorotate dehydrogenase (subfamily 1) family protein

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAACGA AAGATCTTTC GATTACTTTT TGCGGCGTGA AGTTTCCCAA CCCGTTCTGC 
CTCTCTTCTT CGCCGGTAGG CAACTGCTAT GAGATGTGTG CCAAAGCCTA CGACACAGGT 
TGGGGCGGTG TGGTGTTTAA AACGATCGGC TTTTTTACCG CCAACGAAGT CTCGCCGCGT 
TTTGATCATC TGGTGAAAGA AGATACCGGT TTTATCGGCT TCAAAAATAT GGAGCAGATT 
GCTGAACATC CGTTGGAAGA GAATCTGGCC GCCCTGCGTC GGCTGAAGGA AGATTACCCG 
GACAAAGTAT TGATCGCTTC GATCATGGGG GAAAATGAGC AGCAATGGGA GGAGCTGGCG 
CGCCTGGTGC AAGAAGCTGG CGCGGATATG ATCGAGTGTA ACTTCTCCTG TCCGCAAATG 
ACTTCTCATG CGATGGGTAG CGATGTCGGG CAAAGCCCGG AGCTGGTAGA AAAATATTGT 
CGGGCAGTGA AACGGGGTTC CACGCTGCCA ATGCTGGCGA AGATGACGCC GAATATCGGT 
GATATGTGCG AAGTGGCGCT GGCGGCGAAG CGCGGCGGCG CAGATGGCAT TGCGGCGATT 
AACACCGTTA AATCCATCAC CAATATCGAT CTTAATCAGA AAATCGGTAT GCCGATCGTT 
AACGGAAAAT CGAGTATTTC CGGATATTCC GGTAAAGCGG TAAAACCGAT CGCCCTGCGC 
TTCATTCAGC AAATGCGCAC CCATCCAGAA CTGCGCGATT TCCCAATCAG CGGTATCGGC 
GGCATTGAAA CCTGGGAGGA TGCGGCGGAG TTTTTATTGC TCGGCGCAGC AACGTTACAG 
GTCACCACCG GCATTATGCA GTACGGCTAT CGCATCGTAG AAGATATGGC GAGCGGGTTG 
TCGCATTATC TCGCCGATCA GGGATTTGAT TCGTTGCAGG AGATGGTAGG TCTGGCGAAT 
AACAATATTG TCCCGGCGGA AGATTTAGAC CGCAGTTATA TTGTCTATCC CCGTATCAAT 
CTTGATAAAT GTGTTGGCTG TGGACGCTGT TATATTTCCT GTTACGACGG CGGTCACCAG 
GCGATGGAAT GGAGCGAGAA AACCCGCACA CCGCATTGTA ATACCGAGAA ATGTGTGGGT 
TGTCTGCTTT GTGGCCACGT CTGCCCGGTG GGTTGTATTG ATCTCGGAGA AGTGAAGTTT 
AAGAAGGGAG AGAAAGAACA CCCGGTAACG TTGTAA

Protein sequence

MLTKDLSITF CGVKFPNPFC LSSSPVGNCY EMCAKAYDTG WGGVVFKTIG FFTANEVSPR 
FDHLVKEDTG FIGFKNMEQI AEHPLEENLA ALRRLKEDYP DKVLIASIMG ENEQQWEELA 
RLVQEAGADM IECNFSCPQM TSHAMGSDVG QSPELVEKYC RAVKRGSTLP MLAKMTPNIG 
DMCEVALAAK RGGADGIAAI NTVKSITNID LNQKIGMPIV NGKSSISGYS GKAVKPIALR 
FIQQMRTHPE LRDFPISGIG GIETWEDAAE FLLLGAATLQ VTTGIMQYGY RIVEDMASGL 
SHYLADQGFD SLQEMVGLAN NNIVPAEDLD RSYIVYPRIN LDKCVGCGRC YISCYDGGHQ 
AMEWSEKTRT PHCNTEKCVG CLLCGHVCPV GCIDLGEVKF KKGEKEHPVT L