Gene Sare_2835 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2835
Symbol
ID	5708009
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	3219179
End bp	3220300
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	72%
IMG OID	641272291
Product	2-nitropropane dioxygenase NPD
Protein accession	YP_001537661
Protein GI	159038408
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0500011
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGACTG AGCTGTGCGA GCGGTTCGGC ATCGAGTACC CGTTCGTCGG CTTCAGCCCA 
TCCGAGCACG TGGTCGCCGC GATCAGCCGG GCCGGCGGTC TGGGCGTGCT GGGCTGCGTG 
CGGTTCAATG ACCCGGACGA ACTCGACGCG GTACTCACCT GGCTCGACGA CCGGACCGAG 
GGACGGCCGT ACGGGGTGGA CGTGGTGATG CCCAGCAGCG TGCCGGCCGA GGGCGCTCCC 
GCTGATCTCG ACCGGCTGAT TCCGGCCGGG CACCGTGACT TCGTCGAGCG GACCCTGCTG 
CGCCTCGGAG TGCCGCCGCT TGGTGTCGAC AATTCCCAGC GGGCCGGGGT GCTCGGCTGG 
CTGCACTCCG TGGCCCGTTC GCACGTCGAG GTGGCGTTGA CCCACCCGGT TCGACTGGTC 
GCCAACGCCC TCGGCCCGCC GCCACCCGAC GTGATCGCCC AGGCGCACGA GCGGGGCGTG 
GTGGTGGCCG CGTTGGCCGG CCGGGCCGAC CATGCCCGAG GCCACGTGGC GAGCGGGGTC 
GACCTGGTGG TGGCGCAGGG CTACGAGGCC GGCGGCCACA CGGGTGAGAT CGCCAGCATG 
GTGCTGGTGC CGGAAGTGGT CGACGCGGTG GGTGCGCAGG TGCCGGTGCT CGCCGCGGGC 
GGCATCGGTA GCGGCCGGCA GATCGCGGCG GCGCTCGCGC TCGGCGCGTG CGGTGTGTGG 
ATGGGGTCGG TCTGGCTCGG CACCGCCGAA TACCAGAGCA GCGCCGCGTT ACGCGAGGCC 
CTGCTGCGGG CCGGGTCAGC GGACACGGTA CGTAGCCGCG TCTATACCGG TAAGCCGGCC 
AGACTGCTAC GAAATCGGTG GACCGACGCC TGGAGTGAGG AGGCTGCGCC CCGGCCGCTG 
CCGATGCCAC TGCAGAATCT GCTGGTGGCC GAGGCACACA CCCGGCTCAT GGCTTCCGAC 
GATCCGACTG TCGTCCCGAT GCCGGTCGGG CAGATCGTGG GTCGGATGAA CGAGGTGCGT 
CCGGTCGCGG ATGTCCTCGC GGACCTGGCT GCCGAGGCGG ACGAGACGTT GGCCCGGCTT 
GGGACGCTGT CCTGGCGGCG GCTGCCCCCG GGAAGCGGAT GA

Protein sequence

MRTELCERFG IEYPFVGFSP SEHVVAAISR AGGLGVLGCV RFNDPDELDA VLTWLDDRTE 
GRPYGVDVVM PSSVPAEGAP ADLDRLIPAG HRDFVERTLL RLGVPPLGVD NSQRAGVLGW 
LHSVARSHVE VALTHPVRLV ANALGPPPPD VIAQAHERGV VVAALAGRAD HARGHVASGV 
DLVVAQGYEA GGHTGEIASM VLVPEVVDAV GAQVPVLAAG GIGSGRQIAA ALALGACGVW 
MGSVWLGTAE YQSSAALREA LLRAGSADTV RSRVYTGKPA RLLRNRWTDA WSEEAAPRPL 
PMPLQNLLVA EAHTRLMASD DPTVVPMPVG QIVGRMNEVR PVADVLADLA AEADETLARL 
GTLSWRRLPP GSG