Gene Sala_0044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_0044
Symbol
ID	4081537
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	44414
End bp	46099
Gene Length	1686 bp
Protein Length	561 aa
Translation table	11
GC content	69%
IMG OID	638008404
Product	type I phosphodiesterase/nucleotide pyrophosphatase
Protein accession	YP_615103
Protein GI	103485542
COG category	[R] General function prediction only
COG ID	[COG1524] Uncharacterized proteins of the AP superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.360147
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGACGC CGCCCGTGAA GCTCAAATAT CCGATCGCCG CCCTTGTGGG TGCGCTTTGC 
CTTGCCGGTG CCGGAACCAC GGTCGCGCAG GAGGCGGCGC CCGCCGCGCG CCGCGCGACC 
GCCGCGATCC AGGCCCCCAA ACTGCTCGTC GTGATCGCGG TCGACCAGCT GTCGGCCGAT 
CTCTTCGCCG AATATCGTGG CCGCTTCCGC GGCGGTCTTG CGCGGCTCGC AACGGGGGTC 
GTCTTTCCCT CGGCCTATCA GGCGCACGGC GCGACCGAGA CTTGCCCCGG CCATTCGACG 
ATCCTGACCG GCAGCCACCC CGCGCGCACC GGCGTCGTCG CGAACAATTA TTTCGACCTG 
TCGGTCGCGC GCGCCGACAA GCGCGTCTAT TGCGCCGAGG ACGAAACGGT GCCGGACACC 
AGTTCGGGCA GCGGCAAATA TGCGCCGTCG GTCAAGCATC TGCTCGTCCC GACGCTCGGC 
GATCTGATGA AGGCGCGCGA TCCGCAGGCG CAGGTCGTGT CGGTCGCGGG CAAGGACCGC 
GCCGCGATCA TGATGGGCGG GCACCGCGCC GACGAGACGC TGTGGCTCGC GCCCACCGGC 
CTCACCAGCT ATCGCGGTAA GGCGCTGTCG CCGACTGCCG AGCGCGCGGC TACGGTGATC 
GCCGCGGCGA TCAACCAGCC GCGCGGGCCG CTGACGCTGC CCGCCGAATG TGCGGCGCAG 
GATATTGCGA TCCCGCTCGC GAACGGCGCG TCGGTCGGCA CCGGGCGAAT GGCGCGCGAT 
GCGGGCGATT TCCGCCGCTT CCTGGCCTCA CCCGAAGCCG ATGGCGCGGT GCTTGCGACC 
GCCGCCGCGC TGCGTCAGGC GCGCCGGATG GGCCAAGGCA GCGGCACCGA CCTGCTGATC 
ATCGGCCTGT CGGCGACCGA TTATGTCGGG CACGGCACGG GGACCGAGGG CAGCGAAATG 
TGCCTGCAAC TCGCTGGCCT CGACCGCGAG CTTGGCGATT TTCTTGCGCG GCTCGATGCG 
ACCGGGATGA ACTATGCCGT CGTGCTGACC GCCGATCATG GCGGGCACGA CCTCCCCGAA 
CGCAACCGCC AGAATGCGTG GCCCGACGCG CAGCGCATCG ACACGGCGCT GGACCCCGAG 
GCGCTGGGCA ATGAGGTAGC CGAAAAGCTG GGCCTGCCGC AGCCTTTGCT CCATGGCGAG 
GGCGGCGACT ATTATCTCTC GAAGGCCCTG ACCGCTGCGC AGCGCAAAGC CGCGCTTGCC 
GAGATATTGC CGCGCCTGCG CGCGCATCCG CAGGTCGAAA TGGTCGCGAC CCGCGACGAA 
CTGGCGGCGC ATCCCATCTC CAGACGCGCG CCCGATATGT GGAGCGTGAT GGACCGGCTG 
CGCGCTTCCT TTCACCCCGA CCGGTCGGGC GATTTCATCG TCGCGCTCAA GCCCCGCGTC 
ACCCCGATCG CCGAACCGGG CGTGGGCTAT GTCGCGACGC ACGGATCGGT GTGGGATTAT 
GACCGCCGCG TGCCGATGAT CTTCTGGCGC AAGGACCTTG CCGGGTTCGA GCAGCCCAAT 
GCCGTGATGA CGGTCGACAT CATGCCGACG CTCGCGGCAC TGATCGGCCT GCCGGTCGAT 
GCGGGCGCCA TCGATGGCCG CTGCCTCGAC CTGGTTTCGG GTCCGGACAG CAGTTGCCAA 
CAATAA

Protein sequence

METPPVKLKY PIAALVGALC LAGAGTTVAQ EAAPAARRAT AAIQAPKLLV VIAVDQLSAD 
LFAEYRGRFR GGLARLATGV VFPSAYQAHG ATETCPGHST ILTGSHPART GVVANNYFDL 
SVARADKRVY CAEDETVPDT SSGSGKYAPS VKHLLVPTLG DLMKARDPQA QVVSVAGKDR 
AAIMMGGHRA DETLWLAPTG LTSYRGKALS PTAERAATVI AAAINQPRGP LTLPAECAAQ 
DIAIPLANGA SVGTGRMARD AGDFRRFLAS PEADGAVLAT AAALRQARRM GQGSGTDLLI 
IGLSATDYVG HGTGTEGSEM CLQLAGLDRE LGDFLARLDA TGMNYAVVLT ADHGGHDLPE 
RNRQNAWPDA QRIDTALDPE ALGNEVAEKL GLPQPLLHGE GGDYYLSKAL TAAQRKAALA 
EILPRLRAHP QVEMVATRDE LAAHPISRRA PDMWSVMDRL RASFHPDRSG DFIVALKPRV 
TPIAEPGVGY VATHGSVWDY DRRVPMIFWR KDLAGFEQPN AVMTVDIMPT LAALIGLPVD 
AGAIDGRCLD LVSGPDSSCQ Q