Gene Sala_2146 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_2146
Symbol
ID	4080143
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	2253691
End bp	2255886
Gene Length	2196 bp
Protein Length	731 aa
Translation table	11
GC content	65%
IMG OID	638010524
Product	catalase/peroxidase HPI
Protein accession	YP_617188
Protein GI	103487627
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0376] Catalase (peroxidase I)
TIGRFAM ID	[TIGR00198] catalase/peroxidase HPI

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.423847
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGACC AGACCCCCAT CGGAAGCGGC TGCCCCGTCC ACCAGCCCGG CGGCGTTCGC 
TCGCTGCTCG GCCGCACCAA CAAGGACTGG TGGCCCGACA TGCTGGCGAC CGAGATACTG 
ACTCCGAACG GGCCGTCGAA CCCGATGGGT GAGGATTTCG ATTATGCCAA GGCGTTCAAG 
TCGCTCGACT ATTATGCGCT GAAGGACGAT CTCAAGGCGC TGATGACCGA CAGCCAGCCC 
TGGTGGCCCG CCGATTATGG CCATTACGGG CCCTTTTTCA TCCGAATGGC GTGGCACGCC 
GCGGGCACCT ATCGCACCGC CGACGGCCGC GGCGGCGCCA ACAGCGGGCA ACAGCGTTTC 
GCGCCGCTCG ACAGCTGGCC CGACAACGGC AATCTCGACA AGGCGCGCCG CCTGCTTTGG 
CCGATCAAGC AGAAATATGG CAACAAGATC AGCTGGGCCG ACCTGTTCAT CCTGGCTGGC 
AATGTCGCGA TCGAAAGCAT GGGCGGTCCG GTGTTCGGCT TTGGCGGCGG GCGCGTCGAT 
GTCTATGAAC CCGAGCGCGA CATCTATTGG GGCAGCGAAG ACAAATGGGT CAATCAGGGC 
GTGCAGACGC GCATCGACCC GGCGAAGGGG ATGGAGACGA TCGAAGGTCC GCTCGCCGCG 
ATCCAGATGG GCCTGATCTA CGTCAATCCC GAGGGGCCGC AGGGCAACCC CCACGACGAT 
GAGGGGATGG CGCGCGACAT GAAGGAAACC TTCAAGCGCA TGGCGATGAA CGACGAGGAA 
ACCGTTGCGC TCACCGCTGG CGGCCATACT TTTGGCAAGG CGCACGGCAA TGGCGACCCT 
TCGCTGCTCG GCCCCGCGCC CGCGGGCAGC GACCTTGCCG CGCAGGGTTT CGGCTGGGTC 
AGCAGCCACG AGAGCGGCGG CATCGGCGAA CATGCCGTCA CCAGCGGCAT CGAGGGCGCG 
TGGACCAACA CCCCGCGCGA GTGGACCGAG AATTATTTCC GCCTGCTGTT CGACTATGAC 
TATGAACTTG TGAAGTCGCC CGCCGGTGCC TGGCAGTGGC AGCCGATCAA CCAGAAAGAG 
GAGGATATGG CCCCGGCGGC GTGGGATCCC GGCATCAAGG TCCCGACGAT GATGACCACC 
GCCGACATGG CGCTGAAGCG CGATCCCGCC TATCGCGCGA TCAGCGAGCG GTTCCGCAAC 
GACCATGAAG CCTTCAAGGA CGCCTTCGCG CGCGCCTGGT TCAAGCTCAC GCACCGCGAC 
ATGGGGCCGA AGGTCCGTTA TCTCGGCCCC GAAGTCCCTG ACGAGGATCT GATCTGGCAG 
GATCCGATCC CCGCGGGCAC CAAGCCCTCG GACGCCGAAG TTCAGGCGGT GAAGGACAAG 
ATCGCCGCGA GCGGTCTGAC CGTCAGCCAG CTCATCAAGA CCGCCTGGGC GTCGGCCAGC 
ACGTTCCGCA AGTCCGATTT CCGCGGCGGC GCCAATGGCG CGCGCGTGCG CCTCGCGCCG 
CAAAAGGACT GGGAGGTCAA CGAACCCGCG ATGCTCGCCA GGGTGCTGGA CACGCTCGAT 
GGCCTGCGCG GCAGCCTGTC GATGGCCGAT GCGATCGTGC TCGGCGGCGT GGTCGGGCTT 
GAAAAGGCGA TCAGGGATGC GGGCTTCAAC GTCGCCGTGC CGTTTACGGG CGGCCGCGGC 
GATGCGACGC AGGAGCAGAC CGACGTCGAA AGCTTTGAGG TGATGGAGCC CGAGGCCGAC 
GCCTTCCGCA ACTATGTGGG CAAGAAGAAG CTCGCGGTGA AGGTGGAGGA AATGATGCTC 
GACAAGGCGT CGCTGCTCGG CCTGTCGGTG CCCGAAATGA CCGTGCTGAT CGGCGGGCTG 
CGGGTGCTCG GCGCCAATCA TGGCGAGCGC GGCCACGGCC ACTTCACCAG GCGGTCGGGT 
CAGCTCACCA ACGATTTCTT CGTCAACCTG CTCGACATGA CCAATGTGTG GAAGGCGGTC 
GAGGGATCGA ACGACCAGGA ATATGTCGCC ACCGACCGCA CGACCGGCGG CGAGACCTGG 
CGCGCGACTC GGGCCGATCT GATCTTCGGT TCCAATTCGG AACTGCGCGC GGTGGCCGAA 
GTCTATGCCG AGAACGGCCA TGAAGAGAAG TTCGTGCGCG ACTTCGTGAA GGCGTGGACC 
AAGGTGATGA ACGCCGACCG TTTCGACCTC GCCTGA

Protein sequence

MNDQTPIGSG CPVHQPGGVR SLLGRTNKDW WPDMLATEIL TPNGPSNPMG EDFDYAKAFK 
SLDYYALKDD LKALMTDSQP WWPADYGHYG PFFIRMAWHA AGTYRTADGR GGANSGQQRF 
APLDSWPDNG NLDKARRLLW PIKQKYGNKI SWADLFILAG NVAIESMGGP VFGFGGGRVD 
VYEPERDIYW GSEDKWVNQG VQTRIDPAKG METIEGPLAA IQMGLIYVNP EGPQGNPHDD 
EGMARDMKET FKRMAMNDEE TVALTAGGHT FGKAHGNGDP SLLGPAPAGS DLAAQGFGWV 
SSHESGGIGE HAVTSGIEGA WTNTPREWTE NYFRLLFDYD YELVKSPAGA WQWQPINQKE 
EDMAPAAWDP GIKVPTMMTT ADMALKRDPA YRAISERFRN DHEAFKDAFA RAWFKLTHRD 
MGPKVRYLGP EVPDEDLIWQ DPIPAGTKPS DAEVQAVKDK IAASGLTVSQ LIKTAWASAS 
TFRKSDFRGG ANGARVRLAP QKDWEVNEPA MLARVLDTLD GLRGSLSMAD AIVLGGVVGL 
EKAIRDAGFN VAVPFTGGRG DATQEQTDVE SFEVMEPEAD AFRNYVGKKK LAVKVEEMML 
DKASLLGLSV PEMTVLIGGL RVLGANHGER GHGHFTRRSG QLTNDFFVNL LDMTNVWKAV 
EGSNDQEYVA TDRTTGGETW RATRADLIFG SNSELRAVAE VYAENGHEEK FVRDFVKAWT 
KVMNADRFDL A