Gene Sros_5685 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5685
Symbol
ID	8668979
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	6218481
End bp	6219911
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	76%
IMG OID
Product	2-nitropropane dioxygenase, NPD
Protein accession	YP_003341176
Protein GI	271966980
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.140335
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.54089
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCTGAGG CCCGGCCGCC CCTTCTCATC CAGGGCGGGA TGGGGGTCGG CGTGTCCGGG 
TGGCGGCTGG CGCGGGCCGT CGCCCGGACC GGACAGCTCG GCGTGGTGTC CGGGACGGCA 
CTGGACGTCG TGCTGGCCAG GCGGCTGCAA GGCGGAGATC CGGGCGGGCA CCTGCGCAGG 
GCGCTGGCAC GCTTTCCGGC CCCCGAGGTC GCCGAACGGG TCCTGTCCCG GTATTTCGTC 
CCCGGCGGCG CCGGGGACGG CCTGCCGTAC CGGCCGGTGC CCCGGCTCGG CCTGCGCTCG 
CACCGGGTCC GGGACGAGCT CACGGTGGTC GCGAACTTCG CCGAGGTGTT CCTCGCGAAG 
GAGGGGCACG AGGGCCCGAT CGGGATCAAC TATCTGGAGA AGATCCAGAT GGCCACGCCC 
GCCGCCGTCT ACGGAGCGAT GCTCGCCGGT GCCGACTACG TGCTGATGGG GGCGGGCATC 
CCCTCGGAGA TCCCGCGGCT GCTCGACGCG CTCGCCGCGC ACCGGCCGGC GCGGATATCG 
GTCGCGGTGG CGGAGGCCGA CGCGGAGGAC CGCCACACCG TCGGCATCGA CCCGGTGGCG 
CTGCTCGGCC GCACGCCCGG ACCGCTGGAG CGGCCCCGGC TGCTGGCCAT CGTCTCCTCG 
CACGTCCTGG CCGCCTACCT CGCCCGCTCC CCGCAGACCC GTCCGGACGG GTTCGTGCTG 
GAGTCGCCGG TGGCCGGCGG GCACAGTGCG CCGCCCCGGG GCAGGATGCG GCTCGACGCC 
GTCGGCGAGC CGGTCTACGG CCCGCGCGAC GAGGTCGACA CCGGCAAGAT CGCCGCGCTC 
GGGCTGCCGT TCTGGCTGGC GGGCGGCTAC GCGACCCCGG ACGGGCTGGT ACGGGCCGTG 
CGGGCCGGGG CCGCCGGGAT CCAGCTGGGG ACGGCCTTCG CGCTGTGCCG GGAGTCGGGC 
CTGGACGACA CGCTCAGGCG GCGCCTGCTC GGGCGCGCGT CAAGCGGGGG CCTGGAGGTC 
CGCAACGACC CGCGCGCCTC GCCGGCGGGC TTCCCCTTCA AGATCGCTGA GCTGCCGGGA 
ACCCTGTCCG GCCCGGACGT CTACGGCGAC CGCCCCCGCC TGTGCGACCT GGGCCACCTG 
CGCACGCCGT ACCGCAAGGA GGACGGCGCG GTCGGCTACC GCTGCCCCGC CGAGCCGGTC 
GACACGCACG TCCGCAAGGG CCGGCCCGTC GAGGACACCG TGGAGCGCCG CTGCCTGTGC 
AACGGGCTGC TGTCCGCCAT CGGCCTCGGG CAGCGCCGCC CGGACGGCTA CCGGGAGCCC 
CCGCTGCTCA CCCTCGGCCA GGATCTCGGG TTCCTCGACG AGCTGCCGGA GGACTACTCG 
GCCGCCGACG TCGTCGACCA CATCCTCTCC GGGGTGAGGA GCGCGGGCTG A

Protein sequence

MSEARPPLLI QGGMGVGVSG WRLARAVART GQLGVVSGTA LDVVLARRLQ GGDPGGHLRR 
ALARFPAPEV AERVLSRYFV PGGAGDGLPY RPVPRLGLRS HRVRDELTVV ANFAEVFLAK 
EGHEGPIGIN YLEKIQMATP AAVYGAMLAG ADYVLMGAGI PSEIPRLLDA LAAHRPARIS 
VAVAEADAED RHTVGIDPVA LLGRTPGPLE RPRLLAIVSS HVLAAYLARS PQTRPDGFVL 
ESPVAGGHSA PPRGRMRLDA VGEPVYGPRD EVDTGKIAAL GLPFWLAGGY ATPDGLVRAV 
RAGAAGIQLG TAFALCRESG LDDTLRRRLL GRASSGGLEV RNDPRASPAG FPFKIAELPG 
TLSGPDVYGD RPRLCDLGHL RTPYRKEDGA VGYRCPAEPV DTHVRKGRPV EDTVERRCLC 
NGLLSAIGLG QRRPDGYREP PLLTLGQDLG FLDELPEDYS AADVVDHILS GVRSAG