Gene Sala_1149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1149
Symbol
ID	4080894
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	1184498
End bp	1185634
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	68%
IMG OID	638009510
Product	2-nitropropane dioxygenase, NPD
Protein accession	YP_616198
Protein GI	103486637
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.811771
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.827716
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGTCCC CCATTTGCGC GATGCTCGGC ATCGAATTCC CGCTGCTCGC CTTTTCGCAC 
TGCCGCGACG TCGTCGTCGC GGTGTCGAAA GCGGGTGGCA TGGGCGTGTT CGGCGCGGCT 
GCGCTGCCGC CCGAACGGCT GGAAGAAGAG CTGGCGTGGA TCGACGCGCA TATCGGCGGC 
CGCCCCTATG GCGTCGACCT GATCGTCCCC AACAGCTTTG CGGGCAAGGG CGAAGCAGCC 
TCGTCCGGCG CCGCGCAGAT TCCCGAATCC CACCTGAAGT TCGCCGCCGA TCTGCTCGGA 
AGGTTCGATG TCGATGCGAG CGGCCTCGAG ACTGCGATGG AAGCGCGGCA GAGCTTTGGC 
GACAATATGC ACGAAGAAGG CGCCGCAAGG CTGCTCGAGG TCGCTTTCCG CCATCCGATC 
AAGCTGATCG CCAATGCGCT GGGCGTCCCG CCGCCGCTGA TGCTCGAACT CGGCAAGCGC 
CACAACGTCC CGGTCGCCGC GCTTGTCGGC ACGCGCGACC ATGCGCTGGC GCAGGTGCGC 
GCGGGGGTGG ACATCCTTGT CGTCGCGGGC GGCGAAGCGG GCGGCCATTG CGGCGAGGTC 
GCGACGATGG TGCTCGTGCC CGAAGTCGCA GCGGCGCTCG ACGCGATCGG CGACACGACG 
CCGATTCTCG CGGCGGGCGG CATCGTCACC GGGCGCCAGA TGGCGGCGGC GATGGCGATG 
GGCGCCCACG GCGCGTGGAC CGGATCGGTC TGGCTGACGA CCGCCGAAGC CGAGACCAAC 
CCGGTGGTGA AGGAAAAGCT GCTCGCCGCC TCGGCGCGCG ACACGGTGCG CTCGAAGAGC 
CGTACCGGCA AGCCCTCGCG CCAGCTCCGC TCGCCGTGGA CCGATGCGTG GGAAGCCGAA 
GGCGCGCCGA AACCGCTGCC GATGCCGCTC CAGTCGCTGG TCAGCGAACC CGCGCTGCGC 
AAGGTCGACA AGCTGGCGGA AGGCGGCCAC GAGGGTGCAA AAGCACTCGC CACCTATTGG 
GTCGGCCAGG GTGTCGGGCT GATGAACGAG GCAATGGGCG CCGGACAGGT CGTGCAGGCG 
TTCAAGCAGG ACTGGATCGT CGCGTGCGAG CGGCTGAACG GGTTTTTGGA AGAATAG

Protein sequence

MQSPICAMLG IEFPLLAFSH CRDVVVAVSK AGGMGVFGAA ALPPERLEEE LAWIDAHIGG 
RPYGVDLIVP NSFAGKGEAA SSGAAQIPES HLKFAADLLG RFDVDASGLE TAMEARQSFG 
DNMHEEGAAR LLEVAFRHPI KLIANALGVP PPLMLELGKR HNVPVAALVG TRDHALAQVR 
AGVDILVVAG GEAGGHCGEV ATMVLVPEVA AALDAIGDTT PILAAGGIVT GRQMAAAMAM 
GAHGAWTGSV WLTTAEAETN PVVKEKLLAA SARDTVRSKS RTGKPSRQLR SPWTDAWEAE 
GAPKPLPMPL QSLVSEPALR KVDKLAEGGH EGAKALATYW VGQGVGLMNE AMGAGQVVQA 
FKQDWIVACE RLNGFLEE