Gene EcolC_0199 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0199
Symbol
ID	6064526
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	225467
End bp	226864
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	49%
IMG OID	641599600
Product	cytochrome-c peroxidase
Protein accession	YP_001723207
Protein GI	170018253
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.910181
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATGG TCTCACGTAT TACCGCGATC GGCCTGGCTG GCGTCGCGAT TTGCTATTTA 
GGGTTATCTG GTTATGTGTG GTACCACGAT AATAAACGCA GTAAACAGGC CGATGTTCAG 
GCATCTGCTG TCAGTGAAAA TAATAAGGTT TTAGGCTTTC TCCGCGAAAA AGGATGCGAC 
TATTGCCACA CGCCTTCGGC AGAATTACCC GCCTATTATT ATATTCCTGG CGCGAAACAG 
TTGATGGATT ACGACATTAA GCTTGGATAT AAATCTTTTA ACCTCGAGGC CGTGCGTGCG 
GCACTGCTGG CTGATAAACC CGTTTCGCAA AGCGATCTGA ATAAGATTGA ATGGGTGATG 
CAGTATGAAA CTATGCCACC AACGCGTTAT ACCGCGCTAC ACTGGGCGGG TAAGGTGAGT 
GATGAAGAGC GGGCGGAAAT ACTGGCCTGG ATTGCAAAAC AGCGCGCGGA ATATTACGCC 
AGCAATGATA CTGCTCCGGA GCATCGCAAT GAACCGGTGC AGCCCATCCC GCAAAAACTG 
CCTACCGATG CGCAAAAAGT GGCGTTGGGC TTTGCGCTGT ATCACGATCC CCGTTTATCG 
GCTGATAGCA CCATTTCATG CGCTCATTGC CATGCGTTGA ATGCGGGGGG CGTCGATGGC 
AGAAAAACAT CGATTGGTGT TGGTGGCGCA GTTGGGCCGA TTAACGCGCC GACGGTATTT 
AACTCAGTAT TTAACGTTGA GCAGTTCTGG GATGGTCGTG CGGCAACATT GCAGGATCAG 
GCTGGTGGAC CGCCGTTGAA CCCGATTGAA ATGGCGTCGA AATCCTGGGA CGAAATTATT 
GCTAAGCTGG AAAAAGATCC GCAGCTTAAA GCGCAGTTCC TCGGCGTCTA TCCGCAAGGT 
TTCAGTGGCG AAAATATTAC TGATGCCATT GCTGAATTTG AGAAAACATT AATTACGCCG 
GATTCCCCAT TTGATAAATG GTTGCGTGGA GATGAAAATG CGCTGACGGC GCAACAGAAA 
AAAGGCTATC AATTATTTAA AGATAATAAA TGTGCAACTT GTCATGGTGG TATTATTCTC 
GGTGGACGTT CCTTTGAACC GTTGGGGCTG AAAAAAGACT TTAACTTTGG GGAAATTACG 
GCGGCGGATA TTGGTCGTAT GAATGTGACT AAAGAAGAGC GTGATAAATT GCGTCAGAAA 
GTACCCGGTT TACGTAACGT TGCTTTAACG GCACCGTACT TCCATCGCGG TGACGTGCCG 
ACGCTGGACG GGGCGGTGAA ACTGATGCTG CGCTATCAGG TAGGCAAAGA GCTGCCGCAG 
GAGGATGTGG ATGATATCGT AGCTTTCCTG CACAGTCTGA ACGGGGTGTA CACGCCGTAT 
ATGCAGGATA AACAATAA

Protein sequence

MKMVSRITAI GLAGVAICYL GLSGYVWYHD NKRSKQADVQ ASAVSENNKV LGFLREKGCD 
YCHTPSAELP AYYYIPGAKQ LMDYDIKLGY KSFNLEAVRA ALLADKPVSQ SDLNKIEWVM 
QYETMPPTRY TALHWAGKVS DEERAEILAW IAKQRAEYYA SNDTAPEHRN EPVQPIPQKL 
PTDAQKVALG FALYHDPRLS ADSTISCAHC HALNAGGVDG RKTSIGVGGA VGPINAPTVF 
NSVFNVEQFW DGRAATLQDQ AGGPPLNPIE MASKSWDEII AKLEKDPQLK AQFLGVYPQG 
FSGENITDAI AEFEKTLITP DSPFDKWLRG DENALTAQQK KGYQLFKDNK CATCHGGIIL 
GGRSFEPLGL KKDFNFGEIT AADIGRMNVT KEERDKLRQK VPGLRNVALT APYFHRGDVP 
TLDGAVKLML RYQVGKELPQ EDVDDIVAFL HSLNGVYTPY MQDKQ