Gene Sala_1638 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1638
Symbol
ID	4080716
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	1720378
End bp	1721358
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	65%
IMG OID	638010011
Product	2-nitropropane dioxygenase, NPD
Protein accession	YP_616684
Protein GI	103487123
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.397206
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.560122
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTTCA AGACGCGGAT TACGGAGATG CTGGGGATTG CGCATCCGAT CGTCCAGGGG 
GGGATGCAGA GCGTGGGCTA TGCCGAACTG GCGAGTGCGG TGTCGAACGC GGGCGGGCTT 
GGCATATTGA CCGCGCTGAC GCAGCCGGAC CCTGGGGCAT TGCGCGCCGA GATCGAGCGC 
TGCCGCGCGA TGACCGACAA GCCGTTCGGC GTGAACCTGA CTGTATTTCC GACGATCAAC 
GCCCCCGACT ACAAGGCCTA TGCGCAGGCG ATCATCGACG GCGGGGTCAA GATCGTCGAG 
ACCGCGGGCA CGCAGGCGGT GCGCGAGATA TGGGAGATGC TGAAGCCGCA CGGGGTCACC 
ATCCTCCACA AATGCACCGC GGTGCGCCAC GCGCTGTCGG CCGAGCGCGC GGGCTGCGAC 
ATCATTTCGA TCGACGGCTT CGAATGCGCG GGCCACCCCG GCGAGGACGA TGTTCCCGGC 
CTGATCCTGA TCCCGGCCGC CGCCGACAAG GTGAAGATCC CGATGCTCGC CTCGGGCGGC 
TTCGGCGACG GGCGGGGGCT CGTCGCGGCG CTGTCGCTCG GCGCCGAAGG CATCAACATG 
GGCACACGCT TCTGCGCGAC GGTCGAGGCG CCGATCCACG ACAATGTCAA ACAGGCCTAT 
ATCGACAATG ACGAGCGCGG CAGCTTCCTG ATCTTCCGCA GCCTGAAAAA CACCGCGCGG 
GTCGGCAAAA ACGCGGTCAG CGAGGAGGTC GTGCGCCGCC TTTCGGTTCC CGGCGCCACC 
TTCGCCGACG TGGCCGAACT GGTCAACGGC AAGGCAGGTC GCGAACTGCT CGAAACCGGC 
GACCTTTCCA GGGGCGTGTT CTGGGCCGGA ATGGTCCAGG GGCTCATCCA CGACATCCCA 
ACATGCCAGC AACTCGTCGA ACGCATCATC AAGGAAGCAC AAGATATCCT CGACCAAAGA 
CTCGCCGGGT TCAGAAGGTA G

Protein sequence

MAFKTRITEM LGIAHPIVQG GMQSVGYAEL ASAVSNAGGL GILTALTQPD PGALRAEIER 
CRAMTDKPFG VNLTVFPTIN APDYKAYAQA IIDGGVKIVE TAGTQAVREI WEMLKPHGVT 
ILHKCTAVRH ALSAERAGCD IISIDGFECA GHPGEDDVPG LILIPAAADK VKIPMLASGG 
FGDGRGLVAA LSLGAEGINM GTRFCATVEA PIHDNVKQAY IDNDERGSFL IFRSLKNTAR 
VGKNAVSEEV VRRLSVPGAT FADVAELVNG KAGRELLETG DLSRGVFWAG MVQGLIHDIP 
TCQQLVERII KEAQDILDQR LAGFRR