Gene SbBS512_E3921 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E3921
Symbol
ID	6269606
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	3647493
End bp	3648545
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	49%
IMG OID	641727774
Product	di-haem cytochrome c peroxidase family protein
Protein accession	YP_001882207
Protein GI	187733375
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.368802
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATGG TCTCACGTAT TACCGCGATC GGCCTGGCTG GCGTCGCGAT TTGCTATTTA 
GGGTTATCTG GTTATGTGTG GTACCACGAT AATAAACGCA GTAAACAGGC CGATGTTCAG 
GCATCTGCTG TCAGTGAAAA TAATAAGGTT TTAGGCTTTC TCCGCGAAAA AGGATGCGAC 
TATTGCCACA CGCCTTCGGC AGAATTACCC GCCTATTATT ATATTCCTGG CGCGAAACAG 
TTGATGGATT ACGACATTAA GCTTGGATAT AAATCTTTTA ACCTCGAGGC CGTGCGTGCG 
GCACTGCTGG CTGATAAACC CGTTTCGCAA AGCGATCTGA ATAAGATTGA ATGGGTGATG 
CAGTATGAAA CTATGCCACC AACGCGTTAT ACCGCGCTAC ACTGGGCGGG TAAGGTGAGT 
GATGAAGAGC GGGCGGAAAT ACTGGCCTGG ATTGCAAAAC AGCGCGCGGA ATATTACGCC 
AGCAATGATA CTGCTCCGGA GCATCGCAAT GAACCGGTGC AGCCCATCCC GCAAAAACTG 
CCTACCGATG CGCAAAAAGT AGCGTTGGGC TTTGCGCTGT ATCACGATCC CCGTTTATCG 
GCTGATAGCA CCATTTCATG CGCTCATTGC CATGCGTTGA ATGCGGGGGG CGTCGATGGC 
AGAAAAACAT CGATTGGTGT TGGTGGCGCA GTTGGGCCGA TTAACGCGCC GACGGTATTT 
AACTCAGTAT TTAACGTTGA GCAGTTCTGG GATGGTCGTG CGGCAACATT GCAGGATCAG 
GCAGGTGGAC CGCCGTTGAA CCCGATTGAA ATGGCGTCGA AATCCTGGGA CGAAATTATT 
GCTAAGCTGG AAAAAGATCC GCAGCTTAAA GCGCAGTTCC TCGAAGTTTA TCCGCAAGGT 
TTCAGTGGCG AAAATATTAC TGATGCCATT GCTGAATTTG AGAAAACATT AATTACGCCG 
GATTCCCCAT TTGATAAATG GTTGCGTGGA GATGAAAATG CGCTGACGGC GCAACAGAAA 
AAAGGCGGTG ATGCTGCCAA CTTACTGATT TAG

Protein sequence

MKMVSRITAI GLAGVAICYL GLSGYVWYHD NKRSKQADVQ ASAVSENNKV LGFLREKGCD 
YCHTPSAELP AYYYIPGAKQ LMDYDIKLGY KSFNLEAVRA ALLADKPVSQ SDLNKIEWVM 
QYETMPPTRY TALHWAGKVS DEERAEILAW IAKQRAEYYA SNDTAPEHRN EPVQPIPQKL 
PTDAQKVALG FALYHDPRLS ADSTISCAHC HALNAGGVDG RKTSIGVGGA VGPINAPTVF 
NSVFNVEQFW DGRAATLQDQ AGGPPLNPIE MASKSWDEII AKLEKDPQLK AQFLEVYPQG 
FSGENITDAI AEFEKTLITP DSPFDKWLRG DENALTAQQK KGGDAANLLI