Gene SeSA_A4031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A4031
Symbol
ID	6515582
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	-
Start bp	3900386
End bp	3901786
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	48%
IMG OID	642749001
Product	cytoChrome-c peroxidase
Protein accession	YP_002116763
Protein GI	194737894
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAA TTACCCTCTA TGCGACAACG GTTATCACCG TTGGGCTGTT ATGTTATTTA 
GGTTTGTCCG GGTATGTATG GTATTACGAC AAACAGCGCA GTAAAAAAAG CGATGTGCAG 
GCCTCGGTTG TGGGTGAAAA TAATAAAATA CTGGGTTATT TCAGGGAGAA AGGATGTGAT 
TATTGTCATA CGCCTTCCGC TGAATTACCT TTTTATTCCT CTTTTCCGGT GGCAAAGCAG 
CTAATGGATT ACGATATCCA GCTCGGCTAC AAATCGTTTA ACCTGGAGGC GGTACGGGCC 
GCCCTGATTG CGGATACGCC GGTGCCGCAA AGCGAACTGA ATAAAATTGA ATGGGTTATG 
CAACATCAGA CTATGCCGCC AACCCGCTAT GTCGCGCTGC ACTGGGCGGG GGGCGTCAGC 
GATAAAGAGC GTACTGACAT CCTGAACTGG ATAGCCGATC AGCGTGAGCG CAACTATGCC 
AGCGCCGATA CCGACGCCGC GCACCGGAAT GAACCCGTTC AGCCTATTCC GCGCAATATT 
CCCGTCGATG CGAAAAAAGT CGACTTAGGT TTCCGTCTTT ATCATGATGA ACGTTTATCC 
GGCGACAGCA CAATATCCTG TGCGCATTGT CACGCGTTAA ATGCGGGCGG TGTCGATGGC 
AGAAAAACCT CAATTGGCGT TGGCGGTGCG GTAGGACCAA TAAATGCGCC GACGGTATTC 
AACTCCGTAT TTAATATCGA ACAATTTTGG GATGGTCGTG CTGCAACCCT GCAGGAGCAA 
GCAGGCGGAC CGCCGTTAAA TCCTATTGAA ATGGCTTCTA AATCCTGGGA TGAAATTATT 
AGCAAGCTTG ATAAAGATCC TGTCCTGAAA AAAGATTTCC AGGCGGTTTA TCCGCAAGGA 
TTTACCGGGG AAAATATTAC TGATGCGATC GCCGAATTTG AAAAAACGTT GATAACGCCG 
GATTCCGCCT TTGATAAATG GCTACGTGGA GATGAAAATG CGCTGACTGC GCAACAGAAA 
CACGGTTATC AATTATTTAA AGAAAATAAA TGTGCAACCT GTCACGGCGG TATCATTTTA 
GGCGGGCGCT CTTTTGAACC ATTGGGATTA AAGCGAGACT TTAATTTTGG CGAAATTACC 
GCAGCGGATA TTGGTCGTAT GAACGTCACC AAAGAGGTTC GCGATAAATT ACGGCAAAAA 
GTCCCGGGCT TACGCAACGT CGCGTTAACA GCGCCTTATT TCCATCGGGG CGACGTACCG 
ACGCTGGATG GCGCGGTAAA ACTGATGCTG CGTTACCAGG TTGGCACAGA TCTGCCGCAA 
AACGATATTG ACGATATCGT CGCCTTCCTG GAAAGCCTGA CCGGTGTTTA TACGCCATAT 
CAACCTGAAT ATGCGCAATG A

Protein sequence

MKKITLYATT VITVGLLCYL GLSGYVWYYD KQRSKKSDVQ ASVVGENNKI LGYFREKGCD 
YCHTPSAELP FYSSFPVAKQ LMDYDIQLGY KSFNLEAVRA ALIADTPVPQ SELNKIEWVM 
QHQTMPPTRY VALHWAGGVS DKERTDILNW IADQRERNYA SADTDAAHRN EPVQPIPRNI 
PVDAKKVDLG FRLYHDERLS GDSTISCAHC HALNAGGVDG RKTSIGVGGA VGPINAPTVF 
NSVFNIEQFW DGRAATLQEQ AGGPPLNPIE MASKSWDEII SKLDKDPVLK KDFQAVYPQG 
FTGENITDAI AEFEKTLITP DSAFDKWLRG DENALTAQQK HGYQLFKENK CATCHGGIIL 
GGRSFEPLGL KRDFNFGEIT AADIGRMNVT KEVRDKLRQK VPGLRNVALT APYFHRGDVP 
TLDGAVKLML RYQVGTDLPQ NDIDDIVAFL ESLTGVYTPY QPEYAQ