Gene Ndas_2041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2041
Symbol
ID	9245891
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	2462355
End bp	2463401
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	76%
IMG OID
Product	oxidoreductase domain protein
Protein accession	YP_003679973
Protein GI	297560999
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.284403
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGTGG GAGTGGTGGG ACTGGGGATG GGCCTGCACC TGGCGGTGTG GGCCGCCAGA 
CTGGGCATGG ACGTGGTGGC GGCCTGCGAC CGCGACCCCT CCCTGCACGC CGCGGCCCGC 
GAGCGGCTGC CAGGCGCGAC CCTCACCGAC CGCTGGCGGG ACCTGCTCGA CCAGGACTTG 
GACGGGGTCA TTCTGGCCAA CGACTTCGAC GCCCACGCGC CCCTGGCCCT GGCCTTCCTC 
GACCGCGGCG TCCACGTGCT CTCCGAGACC GCCGCGTGCG CCGACGAGGC CGAGGCGAGG 
GCGCTGGTCG CGGCGGCCGA CCGCTCGTCG GCGACCTACT CCCTGGCCGA GAACTACACC 
CTCCACCCGC ACGTGCTGCT CGTCCGCGAG GCCGTCCGGG CGGGCGAACT GGGCCGGATC 
AGCCTCATCG AGGCCGACTA CCTGCACGGC ATGTCCCCCG AGGGCGTCGC CGGGCTGACC 
GGCGACCCCG CCCACTGGCG CGGGCGCATC GCCCCCACCG CCTACTGCAC CCACTCCCTG 
TCACCGATCC TGGCGATCAC CGGTGCGCAC CCGGTGGAGG TCAGCGCGTT CACCGTGGAC 
GAGGCCGCGC CGCGCCAGGC CAGCACCATG GTGGTGCGCC TGTCCACGGG CGCCCTGGCC 
GTCACCCGCA ACGGCTTCCT CCAGGGCGAA CCCGACAGCC ACTGGAGCTG GGTGTCGGTG 
CGCGGCACCC GCGGGCTGGC CGAGTCGGTG CGGGCGCGGG GAGAGCGCGC CTGGTCGGTG 
CGCGTGCGCC ACGAGGGGTG GACCCGCCCC GACGGCGACG CCCACGAGGA GGAACGCGTC 
CCGCCCGCGC TGTCGCTGGA CGGCGAGCCC GTGGAACGCG GGGCCGAGGG CACGGTGCGC 
CTGCTGCGGG GCTTTCGCGA CACCGTCGAG CACGGCGCCG AGCCGCTGGT GCCGGTGCGC 
GCGGCCGTGG CGGCCTCCCT GGTCGGGGTG GCCGGGGCCG AGTCGCTGGC CCGGGGGTCG 
TGTCCGGTCC CGGTTCCGCC GCTGTGA

Protein sequence

MRVGVVGLGM GLHLAVWAAR LGMDVVAACD RDPSLHAAAR ERLPGATLTD RWRDLLDQDL 
DGVILANDFD AHAPLALAFL DRGVHVLSET AACADEAEAR ALVAAADRSS ATYSLAENYT 
LHPHVLLVRE AVRAGELGRI SLIEADYLHG MSPEGVAGLT GDPAHWRGRI APTAYCTHSL 
SPILAITGAH PVEVSAFTVD EAAPRQASTM VVRLSTGALA VTRNGFLQGE PDSHWSWVSV 
RGTRGLAESV RARGERAWSV RVRHEGWTRP DGDAHEEERV PPALSLDGEP VERGAEGTVR 
LLRGFRDTVE HGAEPLVPVR AAVAASLVGV AGAESLARGS CPVPVPPL