Gene EcHS_A3721 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3721
Symbol
ID	5593936
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3709102
End bp	3710499
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	49%
IMG OID	640922836
Product	di-haem cytochrome c peroxidase family protein
Protein accession	YP_001460315
Protein GI	157162997
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	50
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATGG TCTCACGTAT TACCGCGATC GGCCTGGCTG GCGTCGCGAT TTGCTATTTA 
GGGTTATCTG GTTATGTGTG GTACCACGAT AATAAACGCA GTAAACAGGC CGATGTTCAG 
GCATCTGCTG TCAGTGAAAA TAATAAGGTT TTAGGCTTTC TCCGCGAAAA AGGATGCGAC 
TATTGCCACA CGCCTTCGGC AGAATTACCC GCCTATTATT ATATTCCTGG CGCGAAACAG 
TTGATGGATT ACGACATTAA GCTTGGATAT AAATCTTTTA ACCTCGAGGC CGTGCGTGCG 
GCACTGCTGG CTGATAAACC CGTTTCGCAA AGCGATCTGA ATAAGATTGA ATGGGTGATG 
CAGTATGAAA CTATGCCACC AACGCGTTAT ACCGCGCTAC ACTGGGCGGG TAAGGTGAGT 
GATGAAGAGC GGGCGGAAAT ACTGGCCTGG ATTGCAAAAC AGCGCGCGGA ATATTACGCC 
AGCAATGATA CTGCTCCGGA GCATCGCAAT GAACCGGTGC AGCCCATCCC GCAAAAACTG 
CCTACCGATG CGCAAAAAGT GGCGTTGGGC TTTGCGCTGT ATCACGATCC CCGTTTATCG 
GCTGATAGCA CCATTTCATG CGCTCATTGC CATGCGTTGA ATGCGGGGGG CGTCGATGGC 
AGAAAAACAT CGATTGGTGT TGGTGGCGCA GTTGGGCCGA TTAACGCGCC GACGGTATTT 
AACTCAGTAT TTAACGTTGA GCAGTTCTGG GATGGTCGTG CGGCAACATT GCAGGATCAG 
GCTGGTGGAC CGCCGTTGAA CCCGATTGAA ATGGCGTCGA AATCCTGGGA CGAAATTATT 
GCTAAGCTGG AAAAAGATCC GCAGCTTAAA GCGCAGTTCC TCGGCGTCTA TCCGCAAGGT 
TTCAGTGGCG AAAATATTAC TGATGCCATT GCTGAATTTG AGAAAACATT AATTACGCCG 
GATTCCCCAT TTGATAAATG GTTGCGTGGA GATGAAAATG CGCTGACGGC GCAACAGAAA 
AAAGGCTATC AATTATTTAA AGATAATAAA TGTGCAACTT GTCATGGTGG TATTATTCTC 
GGTGGACGTT CCTTTGAACC GTTGGGGCTG AAAAAAGACT TTAACTTTGG GGAAATTACG 
GCGGCGGATA TTGGTCGTAT GAATGTGACT AAAGAAGAGC GTGATAAATT GCGTCAGAAA 
GTACCCGGTT TACGTAACGT TGCTTTAACG GCACCGTACT TCCATCGCGG TGACGTGCCG 
ACGCTGGACG GGGCGGTGAA ACTGATGCTG CGCTATCAGG TAGGCAAAGA GCTGCCGCAG 
GAGGATGTGG ATGATATCGT AGCTTTCCTG CACAGTCTGA ACGGGGTGTA CACGCCGTAT 
ATGCAGGATA AACAATAA

Protein sequence

MKMVSRITAI GLAGVAICYL GLSGYVWYHD NKRSKQADVQ ASAVSENNKV LGFLREKGCD 
YCHTPSAELP AYYYIPGAKQ LMDYDIKLGY KSFNLEAVRA ALLADKPVSQ SDLNKIEWVM 
QYETMPPTRY TALHWAGKVS DEERAEILAW IAKQRAEYYA SNDTAPEHRN EPVQPIPQKL 
PTDAQKVALG FALYHDPRLS ADSTISCAHC HALNAGGVDG RKTSIGVGGA VGPINAPTVF 
NSVFNVEQFW DGRAATLQDQ AGGPPLNPIE MASKSWDEII AKLEKDPQLK AQFLGVYPQG 
FSGENITDAI AEFEKTLITP DSPFDKWLRG DENALTAQQK KGYQLFKDNK CATCHGGIIL 
GGRSFEPLGL KKDFNFGEIT AADIGRMNVT KEERDKLRQK VPGLRNVALT APYFHRGDVP 
TLDGAVKLML RYQVGKELPQ EDVDDIVAFL HSLNGVYTPY MQDKQ