Gene Ndas_2017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2017
Symbol
ID	9245867
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	2437398
End bp	2438552
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	71%
IMG OID
Product	oxidoreductase domain protein
Protein accession	YP_003679949
Protein GI	297560975
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.183817
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGATC ACGTGCTGGG TGTCGCCATG AACGGCGTCA CCGGACGCAT GGGGTACAGG 
CAGCACCTGA CCCGGTCTGT CCTGGCCATC CGGGAGGCGG GCGGCGTACG CCTGCCCGAC 
GGCTCCCGGA TCATTCCCGA GCCCGTCCTG GTCGGACGCT CCGAGCACAA GCTGCGCGAG 
ATCGCCGAAC GCCACGGAAT CGAGCGCTGG TCCACCGACC TGGACGGTGT GCTCTCCGAC 
GACGACATCA CGGTCTACTT CGACTCGCAG ATCACACACG CCCGCGAGGC CGCCGTGCGC 
GCGGCCATCG CCGCGGGCAA GCACGTCTAC GTCGAGAAGC CCACCGCCAG CACGCTCAGC 
GCCGCCCTGG AGCTGGCCAA ACTGGCCCGC GACGCGGGCG TGCGCAACGG CGTGGTCCAG 
GACAAGCTCT TCCTGCCCGG CCTGCTCAAA CTGCGCAGGC TGGTCGAGAG CGGCTTCTTC 
GGCCGGATCC TGTCGGTGCG CGGCGAGTTC GGCTACTGGG TCTTCGAGGG CGACTGGCAG 
CCCGCCCAGC GCCCCAGCTG GAACTACCGC GCCGAGGAGG GCGGCGGCAT GGTGCTGGAC 
ATGTTCCCGC ACTGGCACTA CATCCTGGAG CACCTGTTCG GCCCGGTGCG CGCGGTCACC 
GCCAAGGTGG CCACCCACAT CCCGCGCCGC TGGGACGAGG AGGGACGGCC CTACGAGGCC 
ACGGCCGACG ATTCCGCCTA CGGCATCTTC GAGCTGGACG GCGGCGTCAT CGCCCAGATC 
AACTCCTCCT GGAACGTGCG CGTGGCCCGC GACGAACTCG TGGAGTTCCA GGTCGACGGC 
ACCCACGGCA GCGCCGTGGC GGGACTGCGC TCCTGCCGCG CCCAGCACCG CTCGGCCACG 
CCCAAGGCGG TCTGGAACCC CGACCTGGAG GACCTGGGGC GCTACCGGGA GCAGTGGGAG 
CCGGTGCCCG ACAACACCGA GTTCCCCAAC GGGTTCCGCG CCCAGTGGGA GGACTTCCTG 
CGCCACGTGG TCCTGGACAC CCCCTTCCCG CACGACCTGC TCTCGGGCGC GCGCGGCCTC 
CAGATGGCCG AGGCCGGACT CCAGTCGGCG CGCACCGGCC GCACGATCGA ACTGGACGAG 
GTCACCCTCG CATGA

Protein sequence

MGDHVLGVAM NGVTGRMGYR QHLTRSVLAI REAGGVRLPD GSRIIPEPVL VGRSEHKLRE 
IAERHGIERW STDLDGVLSD DDITVYFDSQ ITHAREAAVR AAIAAGKHVY VEKPTASTLS 
AALELAKLAR DAGVRNGVVQ DKLFLPGLLK LRRLVESGFF GRILSVRGEF GYWVFEGDWQ 
PAQRPSWNYR AEEGGGMVLD MFPHWHYILE HLFGPVRAVT AKVATHIPRR WDEEGRPYEA 
TADDSAYGIF ELDGGVIAQI NSSWNVRVAR DELVEFQVDG THGSAVAGLR SCRAQHRSAT 
PKAVWNPDLE DLGRYREQWE PVPDNTEFPN GFRAQWEDFL RHVVLDTPFP HDLLSGARGL 
QMAEAGLQSA RTGRTIELDE VTLA