Gene SNSL254_A4103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A4103
Symbol
ID	6482298
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	3989179
End bp	3990579
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	48%
IMG OID	642739359
Product	cytochrome-c peroxidase
Protein accession	YP_002043068
Protein GI	194442891
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	77
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAA TTACCCTCTA TGCGACAACG GTTATCACCG TTGGGCTGTT ATGTTATTTA 
GGTTTGTCCG GGTATGTATG GTATTACGAC AAACAGCGCA GTAAAAAAAG CGATGTGCAG 
GCCTCGGTTG TGGGTGAAAA TAATAAAATA CTGGGTTATT TCAGGGAGAA AGGATGTGAT 
TATTGTCATA CGCCTTCCGC TGAATTGCCT TTTTATTCCT CTTTTCCGGT GGCAAAGCAG 
CTAATGGATT ACGATATCCA GCTCGGTTAC AAGTCGTTTA ACCTGGAGGC GGTACGGGCC 
GCCCTGATTG CGGATACGCC GGTGCCGCAA AGCGAACTGA ATAAAATTGA ATGGGTTATG 
CAACATCAGA CTATGCCGCC AACCCGCTAT GTCGCGCTGC ACTGGGCGGG GGGCGTCAGC 
GATAAAGAGC GTACTGACAT CCTGAACTGG ATAGCCGATC AGCGTGAGCG CAACTATGCC 
AGCGCCGATA CCGACCCGGC GCACCGGAAT GAACCCGTTC AGCCTATTCC GCGCAATATT 
CCCGTCGATG CGAAAAAAGT CGACTTAGGT TTCCGTCTTT ATCATGATGA ACGTTTATCC 
GGCGACAGCA CAATATCCTG TGCGCATTGT CACGCGTTAA ATGCGGGCGG TGTCGATGGC 
AGAAAAACCT CAATTGGCGT TGGCGGTGCG GTAGGGCCGA TAAATGCGCC GACGGTATTC 
AACTCCGTAT TTAATATCGA ACAATTTTGG GATGGTCGTG CTGCAACCCT GCAGGAGCAA 
GCAGGCGGAC CACCGTTAAA TCCTATTGAA ATGGCTTCTA AATCCTGGGA TGAAATTATT 
AGCAAGCTTG ATAAAGATCC TGTCCTGAAA AAAGATTTCC AGGCGGTTTA TCCGCAAGGA 
TTTACCGGGG AAAATATTAC TGATGCGATC GCCGAATTCG AAAAAACGTT GATAACGCCG 
GATTCCGCCT TTGATAAATG GCTACGTGGA GATGAAAATG CGCTGACCGC GCAACAGAAA 
CACGGTTATC AATTATTTAA AGAGAATAAA TGTGCAACCT GTCACGGCGG TATCATTTTA 
GGCGGACGCT CTTTTGAACC ATTGGGATTA AAGCGAGACT TTAATTTTGG CGAAATTACC 
GCAGCGGATA TTGGTCGTAT GAACGTCACC AAAGAGGTTC GCGATAAATT ACGGCAAAAA 
GTCCCAGGCT TACGCAACGT CGCGTTAACA GCGCCTTATT TCCATCGGGG CGACGTACCG 
ACGCTGGATG GCGCGGTAAA ACTGATGCTG CGTTACCAGG TTGGCACCGA TCTGCCGCAA 
AACGATATTG ACGATATCGT CGCCTTCCTG GAAAGCCTGA CCGGTGTTTA TACGCCATAT 
CAACCTGAAT ATGCGCAATG A

Protein sequence

MKKITLYATT VITVGLLCYL GLSGYVWYYD KQRSKKSDVQ ASVVGENNKI LGYFREKGCD 
YCHTPSAELP FYSSFPVAKQ LMDYDIQLGY KSFNLEAVRA ALIADTPVPQ SELNKIEWVM 
QHQTMPPTRY VALHWAGGVS DKERTDILNW IADQRERNYA SADTDPAHRN EPVQPIPRNI 
PVDAKKVDLG FRLYHDERLS GDSTISCAHC HALNAGGVDG RKTSIGVGGA VGPINAPTVF 
NSVFNIEQFW DGRAATLQEQ AGGPPLNPIE MASKSWDEII SKLDKDPVLK KDFQAVYPQG 
FTGENITDAI AEFEKTLITP DSAFDKWLRG DENALTAQQK HGYQLFKENK CATCHGGIIL 
GGRSFEPLGL KRDFNFGEIT AADIGRMNVT KEVRDKLRQK VPGLRNVALT APYFHRGDVP 
TLDGAVKLML RYQVGTDLPQ NDIDDIVAFL ESLTGVYTPY QPEYAQ