Gene Ndas_4500 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4500
Symbol
ID	9248380
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	5336269
End bp	5337429
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	69%
IMG OID
Product	undecaprenol kinase
Protein accession	YP_003682394
Protein GI	297563420
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCCTCT TCGAAGCAGT CATCCTTGGC CTCGTCCAGG GACTGACCGA GTTCCTACCG 
ATCTCCTCCA GCGGACACCT GCGCGTGGTG TCGGCCTTCT TCGGCTGGCC CGACCCCGGC 
GCCGCCTTCA CCGCCGTCAG CCAGATCGGC ACCGAGCTGG CCGTGGTGAT CTACTTCCGC 
CAGAGGGTCT GGGCGATCCT GTCCACGTGG ACCAGGTCGC TGTTCAACCG CGAACTGCGC 
AGCGACATCA ACGCGCGCAT GGGCTGGTAC GTGATCCTCG GCTCCGTCCC CATCGTGGTC 
CTGGGCCTGC TCCTGGAGGA GCAGATCGAC AGCGTCTTCC GCGACCTGCG CCTGATCGCG 
CTGAACCTCA TCATCTTCGG CGTGGTCCTC GGCATCGTCG ACCGGTACTC GCGCAAGCAC 
CGCACCCTGG AGGACCTCAA CGTCTCCCGG GGCATGACCT TCGGTCTGTT CCAGGCGCTC 
GCCCTCGTCC CGGGCGTCTC CCGGTCGGGC GGCACCGTCA CCGGCGGGAT GCTGCTCGGC 
TTCAAGCGCG CGGACGCGGC CGAGTACGCC TTCCTGCTGG CGCTGCCCGC CGTCTTCGGC 
TCGGGTCTGT ACAAGCTGAC CGACATCGGT GAGAACGAGT ACGCCGGGTG GGGCGCCACC 
ATCGTGGGCA CGCTCATCGC GGGCGTCGTC GGCTTCATCG TCATCGCCTG GCTGATGCGC 
TTCATCTCCA CGCACAGCTT CATGCCGTTC GTCTACTACC GCGTGGGCCT GGGCATCCTC 
ATCCTGGCCC TGGTGAGCTG GGGCGCGCTC GACCCGCAGG GCGGCGCGGG CGCGCAGCCC 
GCCGAGAGCG AGATCGTCAG CGAGCAGGAG ACGCCGGGGG AGGAGTCCGA ACCCGAGACC 
GACACCGAGG CCGACGCCGG GACCGGCCCG TCCTCCGAGA CGGCCACGGA ACCGTCCGAG 
GAGCCCTCCG AGCAGGCCGT CCCGACCGTC GACCCGGTCA CCGGCTGGGA GATCGACCCC 
GAGGTGGGGC TGCCCCGCAA CCCCGAGACC GGGCTCTACC ACGACTCGGA TCTGGGCATG 
GACGTGGACT ACGACCCGGT CACCGGCCTG GCCACCAACC CGGTGACCGG TGAGACCTAC 
GACCCCAAGG CGGCCGGTTA G

Protein sequence

MSLFEAVILG LVQGLTEFLP ISSSGHLRVV SAFFGWPDPG AAFTAVSQIG TELAVVIYFR 
QRVWAILSTW TRSLFNRELR SDINARMGWY VILGSVPIVV LGLLLEEQID SVFRDLRLIA 
LNLIIFGVVL GIVDRYSRKH RTLEDLNVSR GMTFGLFQAL ALVPGVSRSG GTVTGGMLLG 
FKRADAAEYA FLLALPAVFG SGLYKLTDIG ENEYAGWGAT IVGTLIAGVV GFIVIAWLMR 
FISTHSFMPF VYYRVGLGIL ILALVSWGAL DPQGGAGAQP AESEIVSEQE TPGEESEPET 
DTEADAGTGP SSETATEPSE EPSEQAVPTV DPVTGWEIDP EVGLPRNPET GLYHDSDLGM 
DVDYDPVTGL ATNPVTGETY DPKAAG