Gene Ndas_1031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1031
Symbol
ID	9244877
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	1270457
End bp	1271590
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	80%
IMG OID
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_003678980
Protein GI	297560006
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00494367
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0229045
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGGCG CGACCGACCG CGCGGTGGGC GTGGTGGGCG CCTCCGGGGC CGTGGGCCGG 
GCCGCAGCCC GCCGCCTGCG CGCCCTGGGC CACACCCGCC TGCTGCTCGG GGGGCGCCGC 
ACCGCGCCCC TGGAGGAGCT GGCCGCCGAA CTGGGCCCCG GCACCGCCGT CCGGGCGGTG 
GACGCCGACT CCCCGGAGTC GCTGCGGGCC TTCTGCTCCG GACTCGACGT GGTGCTCAAC 
TGCGCCGGGC CCTCCTACCG CATCGCCGAC GCCGTGGCGG TGCGGGCCCT GGACGCCGGA 
GCCGACTACG TGGACGTGAC GGGCGACGGG CCCGCGCACG ACCGCCTCAG CCGCACCCCC 
GCCGCACGGG ACCACGCGAT CGTCCTGTCG GCGGGGGTGC TCCCCGGCCT GTCCGCCCTG 
CTGCCGCGCT GGTTCGCCGC CCGGCACGGC CTGGAGCGGA TGAGCGCCCA CGCGGGCGGG 
CTGGAGAGGT GCACCGAGGC CGCCGCGGGC GACCTGCTGC TCTCCCTGCC CGGCGCCGAC 
GACCCGACCG CCGTCTTCGG ACGGCCCCTG GCCGCCTGGC GGGAGGGCCG GGTCGTGGAG 
AGGGCGCTGC GCGCCGCCGA CGGCGTCCGG CCGCCCGGGT TCCCGGGCAC CGCGTTCGTC 
CAGCCCTTCC TCACCGAGGA GGCCCGCCGC CTGGCCGCCG ACCTGGGCCT GCGCGAACTG 
GAGTGGTACA ACGTCCACCC CGGCGAGCGG GTCCGCGCCG TGCTGACCTC GGTCGCGGGG 
CGCCCGGTCG CCGACCCGGC CGCGGCGGCG GAGCGCCTGC GGCGCGCGGC CGGGGTGGAC 
CTGGCCGGGC GCACGCCCTA CTACCAGCTC GTGTACGCGC TCACCGCCCC CTCCGGGCGG 
CGCAGCGTGA TGACCGCGCG CTTCTCCGAC AGCTACCGCA TGACCGGCCG CGTGGGCGCG 
CAGGCCGCCG ACGCGGTGGC GCGCGGGCTG GTGCCCCGGG GCCTGCACCA CGCCGCCGAC 
GTCCTCGACC CCGAGGCCGC GGTCACCGCC CTGTTCGACG ACCCCGAGGC CGCGAGCCTG 
CGGGTGGAGG ACGCCGCGAG CGAGGACGCC GGGGTCGAGG AGGGCGCCCT GTGA

Protein sequence

MSGATDRAVG VVGASGAVGR AAARRLRALG HTRLLLGGRR TAPLEELAAE LGPGTAVRAV 
DADSPESLRA FCSGLDVVLN CAGPSYRIAD AVAVRALDAG ADYVDVTGDG PAHDRLSRTP 
AARDHAIVLS AGVLPGLSAL LPRWFAARHG LERMSAHAGG LERCTEAAAG DLLLSLPGAD 
DPTAVFGRPL AAWREGRVVE RALRAADGVR PPGFPGTAFV QPFLTEEARR LAADLGLREL 
EWYNVHPGER VRAVLTSVAG RPVADPAAAA ERLRRAAGVD LAGRTPYYQL VYALTAPSGR 
RSVMTARFSD SYRMTGRVGA QAADAVARGL VPRGLHHAAD VLDPEAAVTA LFDDPEAASL 
RVEDAASEDA GVEEGAL