Gene SeD_A4210 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4210
Symbol
ID	6871455
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	4051642
End bp	4053042
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	48%
IMG OID	642787143
Product	cytochrome-c peroxidase
Protein accession	YP_002217769
Protein GI	198243782
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	77
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAA TTACCCTCTA TGCGACAACG GTTATCACCG TTGGGCTGTT ATGTTATTTA 
GGTTTGTCCG GGTATGTATG GTATTACGAC AAACAGCGCA GTAAAAAAAG CGATGTGCAG 
GCCTCGGTTG TGGGTGAAAA TAATAAAATA CTGGGTTATT TCAGGGAGAA AGGATGTGAT 
TATTGTCATA CGCCTTCCGC TGAATTGCCT TTTTATTCCT CTTTTCCGGT GGCAAAGCAG 
TTAATGGATT ACGATATCCA GCTCGGTTAC AAGTCGTTTA ACCTGGAGGC GGTACGGGCC 
GCCCTGATTG CGGATACGCC GGTGCCGCAA AGCGAACTGA ATAAAATTGA ATGGGTTATG 
CAACATCAGA CTATGCCGCC AACCCGCTAT GTCGCGCTGC ACTGGGCGGG GGGCGTCAGC 
GATAAAGAGC GTACTGACAT CCTGAACTGG ATAGCCGATC AGCGTGAGCG CAACTATGCC 
AGCGCCGATA CCGACCCCGC GCACCGGAAT GAACCCGTTC AGCCTATTCC GCGCAATATT 
CCCGTCGATG CGAAAAAAGT CGACTTAGGT TTCCGTCTTT ATCATGATGA ACGTTTATCC 
GGCGACAGCA CAATATCCTG TGCGCATTGT CACGCGTTAA ATGCGGGCGG TGTCGATGGC 
AGAAAAACCT CAATTGGCGT TGGCGGCGCG GTAGGACCAA TAAATGCGCC GACGGTATTC 
AACTCCGTAT TTAATATCGA ACAATTTTGG GATGGTCGTG CTGCAACCCT GCAGGAGCAA 
GCAGGCGGAC CACCGTTAAA TCCTATTGAA ATGGCCTCTA AATCCTGGGA TGAAATTATT 
AGCAAGCTTG ATAAAGATCC TGCCCTGAAA AAAGATTTCC AGGCGGTTTA TCCGCAAGGA 
TTTACCGGGG AAAATATTAC TGATGCGATC GCCGAATTTG AAAAAACGTT GATAACGCCG 
GATTCCGCCT TTGATAAATG GCTACGTGGA GATGAAAATG CGCTGACCGC GCAACAGAAA 
CACGGTTATC AATTATTTAA AGAGAATAAA TGTGCAACCT GTCACGGCGG TATCATTTTA 
GGCGGGCGCT CTTTTGAACC ATTGGGATTA AAGCGAGACT TTAATTTTGG CGAAATTACC 
GCAGCGGATA TTGGTCGTAT GAACGTCACC AAAGAGGTTC GCGATAAATT ACGGCAAAAA 
GTCCCGGGCT TACGCAACGT CGCGTTAACA GCGCCTTATT TCCATCGGGG CGACGTACCG 
ACGCTGGATG GCGCGGTAAA ACTGATGCTG CGTTATCAGG TTGGCACCGA TCTGCCGCAA 
AACGATATTG ACGATATCGT CGCCTTCCTG GAAAGCCTGA CCGGTGTTTA TACGCCATAT 
CAACCTGAAT ATGCGCAATG A

Protein sequence

MKKITLYATT VITVGLLCYL GLSGYVWYYD KQRSKKSDVQ ASVVGENNKI LGYFREKGCD 
YCHTPSAELP FYSSFPVAKQ LMDYDIQLGY KSFNLEAVRA ALIADTPVPQ SELNKIEWVM 
QHQTMPPTRY VALHWAGGVS DKERTDILNW IADQRERNYA SADTDPAHRN EPVQPIPRNI 
PVDAKKVDLG FRLYHDERLS GDSTISCAHC HALNAGGVDG RKTSIGVGGA VGPINAPTVF 
NSVFNIEQFW DGRAATLQEQ AGGPPLNPIE MASKSWDEII SKLDKDPALK KDFQAVYPQG 
FTGENITDAI AEFEKTLITP DSAFDKWLRG DENALTAQQK HGYQLFKENK CATCHGGIIL 
GGRSFEPLGL KRDFNFGEIT AADIGRMNVT KEVRDKLRQK VPGLRNVALT APYFHRGDVP 
TLDGAVKLML RYQVGTDLPQ NDIDDIVAFL ESLTGVYTPY QPEYAQ