Gene Cwoe_3779 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_3779
Symbol
ID	8734234
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	-
Start bp	4015600
End bp	4016661
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	77%
IMG OID	646504401
Product	2-nitropropane dioxygenase NPD
Protein accession	YP_003395571
Protein GI	284045231
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGCCG CCCGCTTCGC GTTGTACCGG CTGATCCGAC CGATCGTGCA GGCGCCGCTC 
GCCGGCGGTC CGTCGACGCC TGCGCTCGCG GCGGCGGTGT CGGAGGCCGG CGGGCTCGGC 
TTCCTCGCGG CCGGCTACAA GCGCGTCGAC GATGTCGCCG ACGAGATCGT CGCCGTCCGT 
GCGGCGACCA GACGGCCGTT CGGGCTCAAC CTGTTCGTCC CCTCCGGGCA GCCGGCCGAC 
GACGCGACGG TCGCGCCGTA TGTCGCCGCG CTGCGCACGG AGGCGGAACG GCACGGCGTC 
GCGCTCGGCG AGCCGCGCCA CGACGACGAC GGCTGGCAGC AGAAGCTGAC GCTCGTCCAC 
GAGCTGCGTC CCGACGTCGT CTCGTTCACG TTCGGCTGCC CGAGCGGCGA GCAGATCGCC 
GCGCTCCACG CCGACGGCAT CGCCGCCTGG GTGACGATCA CCACGCCCGA CGAGGCTCGC 
ACGGCCGCGG CGGCCGGCGC CGACGCGCTC GTCGTTCAGG GCGCCGAGGC CGGCGGCCAT 
CGCGGGACGT TCGACGACGC GGCACCCGCC GCGATCGGGC TGCTCGCGCT GCTTCAGCTC 
GTCACCGCCG CCGTCGAGCC GCCGCTCGTC GGTGCCGGCG GGGTGATGAA CGGCGCCGGC 
GTCGCGGCCG CGCTGGCCGC GGGCGCGCGT GCCGTGCAGC TCGGCAGCGC GTTCATGCTG 
ACGCCGGAGG CGGGCACGTC GGCGCCGCAC CGGGCCGCGC TCGCCGCGCC GGGCGACACC 
GTGCTGACGC GCGCCTTCAG CGGCCGCACC GCGCGCGGGA TCGTCAACCG CTTCCTCGCT 
GAGCACGACG AAGGCGCGCC GCGCGCCTAT CCCGAGGTCC ACCACCTGAC CGCGCCGCTG 
CGCGCCGCCG CGCGCGAGCG CGGCGACGCG GACGCGCTCA ACCTGTGGGC GGGGCAGGCG 
CACGAGCTGG CAGAAGCGGT GCCGGCGGGC GACATCGTCC GCCGCCTCGC CGACGACGCG 
CGCGACGCGC TGCGTGTCGC GGCCGAGCGC GCCGGCGCGT AG

Protein sequence

MPAARFALYR LIRPIVQAPL AGGPSTPALA AAVSEAGGLG FLAAGYKRVD DVADEIVAVR 
AATRRPFGLN LFVPSGQPAD DATVAPYVAA LRTEAERHGV ALGEPRHDDD GWQQKLTLVH 
ELRPDVVSFT FGCPSGEQIA ALHADGIAAW VTITTPDEAR TAAAAGADAL VVQGAEAGGH 
RGTFDDAAPA AIGLLALLQL VTAAVEPPLV GAGGVMNGAG VAAALAAGAR AVQLGSAFML 
TPEAGTSAPH RAALAAPGDT VLTRAFSGRT ARGIVNRFLA EHDEGAPRAY PEVHHLTAPL 
RAAARERGDA DALNLWAGQA HELAEAVPAG DIVRRLADDA RDALRVAAER AGA