Gene Ndas_5104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5104
Symbol
ID	9248996
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	+
Start bp	250809
End bp	251873
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	74%
IMG OID
Product	UDP-N-acetylenolpyruvoylglucosamine reductase
Protein accession	YP_003682991
Protein GI	297564018
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.486269
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGCAC TCTCCGAGTA CACCACCCTG CGTCTGGGCG GCCCGGCGCG GACCTTCCTG 
GTCGCGGGCA CCACCGACGA ACTGGTCGCC GCCGTGACCC GGGCCGACGC CGCCGGCGAG 
CCCGTCCTCG TCCTGGGCGG CGGCAGCAAC CTCGTGGTCT CCGACGACGG GTTCCCCGGA 
ACGGTGGTCC TCGTGGACTC CAAGGGCGTC TCCTTCGAGG AGGCGGGCAC CGACGACGAG 
GGCGAACCGG TCGTGCTGCT GCGCGCCGAC GCGGGCGTGG AGTGGGACCC GCTGGTGGAG 
CGCGTCGTGG CCGAGGGCCT CAGCGGGCTG GAGTTCCTGT CGGGCATCCC CGGCCGGGTC 
GGCTCCACGC CCATCCAGAA CGTGGGCGCC TACGGCCAGG ACGTCAGCCA GACCATCCGC 
GAGGTGCTCG TCCACGACCG GCGCACCGGC GAGCGGCGCC GGATGACCAA CGCCGAGTGC 
GGCTTCAGCT ACCGCGACAG CGTCTTCAAG GGCGACGACC GCCACGTGGT GTGCGAGGTG 
GTCTTCGCGC TGCGCCGCTC CAAGCTCAGC CGTCCGGTCG CCTACGCCGA GGTGGCCCGC 
ACCTTGGGGG CCGAGGCGGG CACCCGGGTG CCGCTGGAGC GGGCGCGCGA GACCGTCCTG 
GGGCTGCGCA GGGGCAAGGG CATGGTCCTG GACCCCGCCG ACCCCGACAC CCGCAGCGCC 
GGGTCGTTCT TCACCAACCC GGTGGTCACC GCCGAGGAGT TCGCGGCCGT GCGCGAACGG 
GCGGCCGCCC GCCTGGGCGC CGACGTACAG GTGCCCGGCC ACCCCGACGC ACGGGGGAAC 
GTCAAGCTCT CCGCGGCCTG GCTGATCGAC CGCGCCGGGT TCACCAAGGG GTACGGCGAC 
GGCCCCGCGC GCATCTCCGG CAAGCACAGC CTGGCCCTGA CCAACCCCGG CGGCGCCACC 
ACGAAGGACC TGCTGGAGCT GGCCCGCGAG GTGCGGGCGG GAGTGGAGGA GGCCTTCGGG 
GTCCGCCTGG TCAACGAGCC GGTGATGGTC GGCGTCTCCC TCTGA

Protein sequence

MTALSEYTTL RLGGPARTFL VAGTTDELVA AVTRADAAGE PVLVLGGGSN LVVSDDGFPG 
TVVLVDSKGV SFEEAGTDDE GEPVVLLRAD AGVEWDPLVE RVVAEGLSGL EFLSGIPGRV 
GSTPIQNVGA YGQDVSQTIR EVLVHDRRTG ERRRMTNAEC GFSYRDSVFK GDDRHVVCEV 
VFALRRSKLS RPVAYAEVAR TLGAEAGTRV PLERARETVL GLRRGKGMVL DPADPDTRSA 
GSFFTNPVVT AEEFAAVRER AAARLGADVQ VPGHPDARGN VKLSAAWLID RAGFTKGYGD 
GPARISGKHS LALTNPGGAT TKDLLELARE VRAGVEEAFG VRLVNEPVMV GVSL