Gene Sare_1611 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1611
Symbol
ID	5703466
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	1842326
End bp	1843783
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	69%
IMG OID	641271120
Product	2-nitropropane dioxygenase NPD
Protein accession	YP_001536495
Protein GI	159037242
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0274193
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAACTTC CGATCATCAT TCAGGGCGGA ATGGGTGTCG GCGTCTCCAG CTGGCGGCTG 
GCGGCAGCGG TATCAGCCGC AGGCCAGCTC GGAGTGGTGT CCGGAGTGGC ACTGGACGCG 
TCCCTGGCCC GCCGGCTCCA GCTCGGCGAC GAGGACGGCA CGCTACGGCA GGCACTGGCC 
GCATTCCCCG TGCCGGAACT CGCCCAGCGA GTGCTGGACC GCTACTACGT GCCGGGCGGA 
ATCCCCGCGG GAAGACCGTT CCGACCGGCA CCGCTGCTGA GTATGCGGCC ACGCCGACAT 
GCCAACGAGC TTGCCGTGGT CGCCAACTTC GTCGAGGTAC ACCTGGCCAA GCAGGGCCAC 
GACGGTGTCA TCGGAATCAA CTACCTGGAA AAGATCCAAC TTGCTACCCC CGCCGCGGTG 
TACGGAGCGA TGTTGGCCGG TGTCGACTAC ATCCTGATGG GGGCCGGCCT GCCCAGTGAG 
ATTCCGTCAC TGATCGACGC CCTGAGCCGC CACCAGCCGG TCCGGTTGCC CGTCACCGTC 
GACGGGGGCC AATCGGGCGA AACCTATACG GTTGCCTTCG ACCCGCCCGA CCTGGCCGGT 
GACCTACCGC CCCTCCCCCG GCCGCGGTTC CTGGCCATCG TCTCCGCCGC GTCCCTGGTC 
AGCTACCTTG CGCGCAGTCC TCGTACGCGC CCCGACGGCT TCGTCCTCGA AGGGGCCACC 
GCAGGTGGTC ACTCGGCGCG GCCACGGGGC AGGATGGTCC TCGACGACAA CGGCGAACCC 
GTCTACGGTG AGCGCGACCG GCTCGACCTG GCCAAGGTAG CCGCATCCGG GGCGCCGTTC 
TGGGTTGCCG GCGGACAGGC CGACCCACGA CGGTTGGCCA CAGCCCAAGC AGCCGGGGCC 
ACCGGCATTC AGGTCGGTAC CGCATTCGCC CTGTGTCGCG AATCGGGAAT CAACCCCCGG 
TTGCGGCACC AGGTGCTCCA GCAGGCAATC GGCGGGCAGC TCGCAGTCCG CAACGATCCG 
GCCGCCTCCC CGACCGGCTT CCCGTTCAAG ATCGCCCAAC TGGACGGCAC CGCCGCCGAG 
GAATCTGTGT ATCGTTCCCG GACCCGCCGG TGCGACCTGG GATACCTGCG CACCCCGTAC 
CTGCGGCCGA CTGGCCGGAT CGGGTTCCGG TGCATGGCAG AGCCGGTTGA GGACTACATC 
CGCAAGGGCG GCGCAGCCGA GGACACCACG GGGAGCCGTT GCCTGTGCAA CGGGCTGATG 
GCCACGATCG GCCTGGGCCA ACGACGCGGT GGCGGCGAGG TTGAGCCACC GCTGGTCACC 
CTCGGCCAGG ACATCCGCGT GCTGACCGAA CTGCACCAAC GCTTCGGCGA CGATTACACG 
GCCAGGGACG TCCTGCGCTA CCTGACCGCC GTGGACGGCC ACCAGACCGA CGCCGGCGAA 
CCGGCGGGTG CGGGGTGA

Protein sequence

MELPIIIQGG MGVGVSSWRL AAAVSAAGQL GVVSGVALDA SLARRLQLGD EDGTLRQALA 
AFPVPELAQR VLDRYYVPGG IPAGRPFRPA PLLSMRPRRH ANELAVVANF VEVHLAKQGH 
DGVIGINYLE KIQLATPAAV YGAMLAGVDY ILMGAGLPSE IPSLIDALSR HQPVRLPVTV 
DGGQSGETYT VAFDPPDLAG DLPPLPRPRF LAIVSAASLV SYLARSPRTR PDGFVLEGAT 
AGGHSARPRG RMVLDDNGEP VYGERDRLDL AKVAASGAPF WVAGGQADPR RLATAQAAGA 
TGIQVGTAFA LCRESGINPR LRHQVLQQAI GGQLAVRNDP AASPTGFPFK IAQLDGTAAE 
ESVYRSRTRR CDLGYLRTPY LRPTGRIGFR CMAEPVEDYI RKGGAAEDTT GSRCLCNGLM 
ATIGLGQRRG GGEVEPPLVT LGQDIRVLTE LHQRFGDDYT ARDVLRYLTA VDGHQTDAGE 
PAGAG