Gene Sala_2875 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_2875
Symbol
ID	4080668
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	3026366
End bp	3027400
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	72%
IMG OID	638011259
Product	putative DNA-binding/iron metalloprotein/AP endonuclease
Protein accession	YP_617913
Protein GI	103488352
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0533] Metal-dependent proteases with possible chaperone activity
TIGRFAM ID	[TIGR00329] metallohydrolase, glycoprotease/Kae1 family

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.640549
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCTGA TCCTCGGCCT CGAATCGAGC TGCGACGAAA CGGCAGCGGC GCTTGTCACC 
GGCGACCGGC GCGTCCTCGC GCACCGCGTT GCGGGACAGG AGGCCGAACA CCGGCCCTAT 
GGCGGCGTGG TACCCGAAAT CGCCGCGCGC GCGCATGTCG ACCGGCTCGC GCCGATCGTC 
GAAGGCGTGC TCGATGACGC GGGCGTGACG CTCGCCGACG TCGATGCGAT CGCAGCGACC 
GCCGGGCCGG GGCTGATCGG CGGGGTGATG GTCGGCCTCG TCACCGGCAA GGCGCTGGCG 
CACGCCGCGA ACAAGCCGCT GATCGCGGTC AACCATCTCG AGGGCCATGC GCTCAGCCCG 
CGGCTCGCCG ATCCGACCCT CGACTTTCCC TATCTGCTGC TGCTCGTCTC GGGCGGGCAT 
TGCCAGTTGC TGCTCGTAAA GGGCGTCGGC GATTATCGCC GTCTCGCCAC CACGATCGAC 
GATGCCGCGG GCGAGGCGTT CGACAAGACC GCCAAGCTGC TCGGCCTCGG CTATCCGGGT 
GGTCCCGCGG TCGAACGCAT CGCGGCCGAA GGCGACCCGC ACGCCGTGCC GCTGCCGCGC 
CCGCTCGTCG GCAGCGCCGA GCCGCATTTC TCCTTTGCCG GGCTGAAAAG CGCGGTCGCG 
CGCGCCGCGG CGAGCGGAAC CCATGACGTT GCCGATCTCG CTGCCTCGTT CCAGCAGGCC 
GTCGTCGACT GCCTCGTCGA TCGCAGCCGC GGCGCGCTCG CGGCGTGCCC CGATGCCAGG 
GCCTTCGTCG TCGCGGGCGG CGTCGCGGCC AATGGCGCGA TCCGCACCGC GCTCACCGAC 
CTCGCCGCGC GCTTCGACAA GCCCTTCGTC GCGCCGCCGC TGTGGCTCTG CACCGACAAT 
GGCGCGATGA TCGCCTGGGC GGGCGCCGAA CGCTTTGCCG CGGGGCTGAC CGACCCGCTC 
GATACTGCGG CGCGCCCGCG CTGGCCGCTC GACCCCGCAG CCGAAGCAGT GCGCGGCGCG 
GGAGTGAAAG CATGA

Protein sequence

MTLILGLESS CDETAAALVT GDRRVLAHRV AGQEAEHRPY GGVVPEIAAR AHVDRLAPIV 
EGVLDDAGVT LADVDAIAAT AGPGLIGGVM VGLVTGKALA HAANKPLIAV NHLEGHALSP 
RLADPTLDFP YLLLLVSGGH CQLLLVKGVG DYRRLATTID DAAGEAFDKT AKLLGLGYPG 
GPAVERIAAE GDPHAVPLPR PLVGSAEPHF SFAGLKSAVA RAAASGTHDV ADLAASFQQA 
VVDCLVDRSR GALAACPDAR AFVVAGGVAA NGAIRTALTD LAARFDKPFV APPLWLCTDN 
GAMIAWAGAE RFAAGLTDPL DTAARPRWPL DPAAEAVRGA GVKA