Gene Ndas_2850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2850
Symbol
ID	9246701
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	3402150
End bp	3403415
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	76%
IMG OID
Product	putative oxygenase subunit protein
Protein accession	YP_003680767
Protein GI	297561793
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCAGGA TCCTCGTCGT CGGAGCCGGA CAGTCCGGAC TCCAGCTGGC CGTCGGCCTG 
CTGGGCGAGG GGTACGAGGT GACCCTGGCC ACCGAGGCCG GGCCTGAGGA GGTCCGCGCC 
GGGCGGGTCA CGTCCACGCA GTGCCTCTTC GGCCCCGCCC TGCGCCGCGA GCGCCGCCAC 
GGCCTCGCCT TCTGGGACGA CCGCGCGCCC GCCGTCCGCG GCGTCGGGTT CCGCGTGGCC 
GACCGCGCCG GGGCGGGCGC CCCCGCCCTG TCCTGGGTCG GCGCGCTGGA CGAGCACGCC 
CAGTCGGTCG ACCAGCGGCT CAAGATGTCG GCCTGGCTCG ACCTGTTCGT CCGGCGCGGC 
GGCGCCCTCC TGCGCGGGCG CGTCCTGGCC GAGGACCTGG AACGGCTCGC CGCCGACCAC 
GAACTCACCG TCGTCGCCTC CGGGCGCGGC GCGCTCTCCG AGGTCTTCCC CCGCGACACC 
CGGCGCTCGC ACTTCCGGTC CCCGCAGCGC TCCCTGGCGC TGGCCTACGT GACCGGCGCC 
GGGCCCCACC CCGACGGGCC CGTGCTCAGC CGCACCGTCG TCCCCGGCGC GGGGGAGGTC 
ACCACCCTGC CCACCTACTC CCTGGCCGGG GTCTGCGAGG CCGTCATGGT CGAGGCGGTG 
CCCGGCGGCC CCCTGGACCG GCCGCTGCCC CCCGGCGCCT CCGGCGAGGA GGTCCTCGCG 
GGCCTGCTGG ACGTGCTGTA CCGCGAGGCG CCCTGGGAGT ACGAGCGCCT GGCCCACGCC 
CGCCTCGCCG ACCCGGGGGC GGCCCTGCGC GGCGGCTACG CGCCGGTGGT GCGCGAACCC 
GTCGCCCGCC TGGCGAACGG AACCCCCGTC CTGGGCATGG CGGACTCCGT GGTCGCCAAC 
GACCCCGTCA CCGCGCAGGG GGCCAACATG GCCTCCTTCG GCGCCGAGGT CTACCGCCGC 
GCCGTCGTCG ACCACGGACG TCGGCCCTTC GACGAGGCCT TCATGCGCTC GGCGTTCGCC 
GCCTACTGGC GCCTGGCCAG CCAGGTGACC GCGTGGAGCA GGGTCCTGCT CACCGCTCCG 
CCGCACCTGG AGGAGCTGTA CCGCCTCGCC GCGCGCCACC AGGAGACGGC CGACCGCTTC 
GCCAACTGCT TCAGCGACCC CGGCGACCTG ATCGGGTGGT TCCTGCACCC CGAACGGGCA 
CTGGCCTACG TGGACGGCGT CCGGCGCGCC GAACCCGCAC GGTCATCCCA TCTCCCTATC 
TCCTGA

Protein sequence

MRRILVVGAG QSGLQLAVGL LGEGYEVTLA TEAGPEEVRA GRVTSTQCLF GPALRRERRH 
GLAFWDDRAP AVRGVGFRVA DRAGAGAPAL SWVGALDEHA QSVDQRLKMS AWLDLFVRRG 
GALLRGRVLA EDLERLAADH ELTVVASGRG ALSEVFPRDT RRSHFRSPQR SLALAYVTGA 
GPHPDGPVLS RTVVPGAGEV TTLPTYSLAG VCEAVMVEAV PGGPLDRPLP PGASGEEVLA 
GLLDVLYREA PWEYERLAHA RLADPGAALR GGYAPVVREP VARLANGTPV LGMADSVVAN 
DPVTAQGANM ASFGAEVYRR AVVDHGRRPF DEAFMRSAFA AYWRLASQVT AWSRVLLTAP 
PHLEELYRLA ARHQETADRF ANCFSDPGDL IGWFLHPERA LAYVDGVRRA EPARSSHLPI 
S