Gene Ndas_3879 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3879
Symbol
ID	9247750
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	4650120
End bp	4651451
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	73%
IMG OID
Product	nucleotide sugar dehydrogenase
Protein accession	YP_003681782
Protein GI	297562808
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTCGAAG CGGACCGTAT GCGCGTCTCC GTCATCGGTA CCGGGTACCT GGGTGCCACC 
ACCGCGGCCT GCCTGGCCGA GATGGGGTTC GAGGTCCTGG GACTCGACGT CGACGAGGCC 
AAGATCGACA TGCTCCGCTC CGGCAGGGTC CCCTTCTTCG AGCCCGGGCT CGAAGAGCTG 
CTCACCGCGA ACCTGGGAAC CGGCCGCCTG CACTTCACGA CCTCCTTCGC CGAGGCCGCG 
GAGTTCGCCG ACCTGCACCT GATCTGCGTG GGCACCCCTC AGCGCGACGA CTCCGGCGCG 
GCCGACCTGC GCTACGTCAA CGCCGCGGTG GACCAGCTGG CCCCGCACCT GACCCGCCCC 
ACCGTGGTCG TGGGCCGCTC GACCGTTCCG GTGGGCACCG CGGCGACCCT GGCCGCCCGG 
CTGTCCGCGC TGGCCCCCGT GGGCGAGGAG GCCGAGCTGG GGTGGAGCCC GGAGTTCCTG 
CGCGAGGGCT TCGGGGTGGA GGACACCCTG CACCCGAACC GGATCGTGAT CGGCACCGAC 
TCCCCCCGGG TCGAGAAGGC CGTGCGCGCC CTGTGGCAGC GCCAGATCGA CGACGGCGTC 
CCCTTCCTGC TGACCGACCT CCAGACCGCC GAGCTGGTCA AGGTGTCGGC CAACGCCTTC 
CTGGCCACGA AGATCTCCTT CATCAACGCC ATGGCGGAGG TGTCGGAGGT GGCCGGGGCC 
GACGTCATCC AGCTGGCCGA GGCGCTGTCC TACGACGACC GCATCGGCGG CAAGTTCCTC 
GGCCCGGGCC TGGGCTTCGG CGGCGGCTGC CTGCCCAAGG ACATCCGCGC GTTCATGGCG 
CGCGCCGACG AGCTGGGCGT GGAGCCCGCG CTGTCCTTCC TGCGCGAGGT GGACGCGATC 
AACCAGCGCC GCCGCGCGCG CACCATCGAC ATCGCCCGCC AGCTGATCGG CGGGAGCTTC 
GCCGGGCGCA CGGTGACCGT GCTGGGCGCG GCGTTCAAAC CCAACTCCGA CGACATCCGC 
GACTCGCCCG CCCTGGACGT GGCCTCCACC ATCGCCTCCC TGGGAGCGCA GGTGACGGTG 
TACGACCCGC GGGCGCTGGA GCGGGCGCGC GAGGCGCACC CGGAGCTGAA CTACGCCGAC 
TCCATGCTGG CGGCGGCGCG CGGCGCCGAC GTGGTGCTGC TGCTCACCGA GTGGGCGGAG 
TTCCGCGAGG CCAACCCGGA GGAGCTGGCC GGGGTGGTGG CCCGCAAGCG CATCGTGGAC 
GGGCGCAACG CGCTCGACCC CACGTACTGG CGCGCCTCGG GCTGGACCTA CCGGGCACTG 
GGCCGCCAGT AG

Protein sequence

MVEADRMRVS VIGTGYLGAT TAACLAEMGF EVLGLDVDEA KIDMLRSGRV PFFEPGLEEL 
LTANLGTGRL HFTTSFAEAA EFADLHLICV GTPQRDDSGA ADLRYVNAAV DQLAPHLTRP 
TVVVGRSTVP VGTAATLAAR LSALAPVGEE AELGWSPEFL REGFGVEDTL HPNRIVIGTD 
SPRVEKAVRA LWQRQIDDGV PFLLTDLQTA ELVKVSANAF LATKISFINA MAEVSEVAGA 
DVIQLAEALS YDDRIGGKFL GPGLGFGGGC LPKDIRAFMA RADELGVEPA LSFLREVDAI 
NQRRRARTID IARQLIGGSF AGRTVTVLGA AFKPNSDDIR DSPALDVAST IASLGAQVTV 
YDPRALERAR EAHPELNYAD SMLAAARGAD VVLLLTEWAE FREANPEELA GVVARKRIVD 
GRNALDPTYW RASGWTYRAL GRQ