Gene Ndas_4954 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4954
Symbol
ID	9248842
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	+
Start bp	95798
End bp	97921
Gene Length	2124 bp
Protein Length	707 aa
Translation table	11
GC content	74%
IMG OID
Product	thymidylate kinase
Protein accession	YP_003682842
Protein GI	297563869
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.768884
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.910988
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGAT CTGCACCCCT GGGAGCGCCG GCCGAGGCGC GCAACGTTCT TGCGATCACA 
CCCTTCCGAA GGCTGTGGAT CTCTCTCTCC CTCTCCAGCC TGGGCGACTG GCTCAGCCTG 
CTGGCACTGG TGTCCCTGGC GACCGTCTTC ACCGCCGACG GATCCCAGCT CGTCCAGTAC 
CTGGCCGTCA GCGGCGTCGT GGCGATCAAG CTCGCCCCGT CGATCCTGCT CAGCCCCCTG 
GTCGGGTCGG TCGCCGACCG CCTCGACCGC AGGTGGACGA TGGTGGTCGG CGACGTCCTG 
CGCGCCGTGC TGTACGTCTC CATCCCGGTC GTGGGCCTCC TCTTCCCCGG CTTCGCCCTG 
GAGTGGCTCC TCATCGCCAC CCTCCTGGCC GAGGTCGTCG CCCTGTTCTG GACCCCGGCC 
AAGGACGCCA CGGTCCCCAA CCTGGTGCCC CGCAAGCTGC TGGGGCAGGC GAACCGGCTG 
AGCCTGCTCA CCGCCTACGG CACCGCGCCC GTCGCGGCGC TGCTGTTCGC CGCGCTCGCC 
TCGGTCAGCA ACGTGCTCGG CGCGTTCCTG CCCTCCATGG CCAGCCCCGA GGCCGACGTC 
GCCCTCTACC TCAACGGCCT CACCTTCGTC GTCGCGGCGG TCGTCGTCGC CGGGCTGCCG 
ATCCCCAGGC ACAAGCCCTC CAAGGACGCG GAGAGCGACA CCCGCGACAG CGGCATCCTG 
CGCGCGCTGG GGACCGGTCG GCGCCACGCG GGCGGCACGC CCCGCGTGCG CGGCCTGGTT 
CCGGGCATGC TCTGCGTCGT GGCCGCCGGG GGCGTGGTCA TCGGTGTCGG CCGCGTGCAC 
GTCGAGGGCC TGGGCGCGGG CAACGCCGGT TTCGGCGTGG TCTTCGCCGC GGTCTTCGCG 
GGCATGGCCC TGGGCGTGCT CGCCGGGCCG CGCGTCCTCA AGCAGTTCAG CCGCAGCCGG 
CTGTTCGGTC TGAGCATCGC CCTCGCCGGG CTGGCCCTGC TGTTCGCCGG GGCCGTCGCC 
GACATGGTGC TCACCGCCGT GCTCACCGCG CTGCTCGGCG TGGGCGCGGG TATCGCCTGC 
GTGATCGGCC TGGCGGTGTT CGACCGCGAG GTGGAGGACG AGCACCGGGG TTCCGCCTTC 
GCCTTCCTGC ACGGCGCCGC CCGCGTCACC CTGGTCGGCG CCGCCGTGCT CGCCCCGCTG 
GCCGCCGGGC TCATCGGCAG TTACCGGATC CCGGTCGGCC CCCTGAGCTA CGACCTGCGC 
GGCAGCGGCC TCGTCCTCAT GCTCTCCGGC CTGGCCGTCC TGGTCGTGGC GCTGGTCTGC 
TACCGGCGGA TGAACCGCCG GGACGACCCC GAGGCCGGTC CCGGCCTGCT CCCGGAGCTG 
TTCGCGGCGC TGCGCGGCGT CGCGATCGCG CCGGAGGAGG ACGAGGAGGC CAGGCTCGCG 
GGCGCGTTCA TCGTCGTCGA GGGCGGCGAG GGCGCGGGCA AGTCCACCCA GGTGCGCGAG 
CTGACGGTGT GGCTGCGCGA CCAGGGGTTC GAGGTGATCG GCACCCGCCA GCCGGGCGCG 
ACCAAGCTCG GCATGCGCCT GCGCGGCCTG CTCCTGGACC GGGAGAACTC GCACATCACC 
CCGCGCGCCG AGGTGCTGCT CTACGCGGCC GACAAGGCCG ACCACGTCCA GCAGGAGATC 
CTGCCCGCCC TGCGGCGCGG CGCGGTCGTC ATCAGCGACC GCTACGTGGA CTCCCTGCTG 
GCCTACCAGG GCTCGGGGCG CGACCTGTCC TCGGACGAGA TCCGCCGGAT CAGCGACTGG 
GCCACGCAGG GCCTGGTTCC GGACCTGACG GTGCTGCTCG ACGTGCGGCC GGAGGACGGC 
CTGTCCCGCC TGGGCGGCCC GGCCGACCGC ATCGAGGGCG AGCCTGCGGA GTTCCACGAC 
CGGGTCCGCC GGGGCTTCCT GGAGCTGGCC AGGGCCGCGC CGGAGCGCTA CCTGGTGCTC 
GACGCCCGCG AGCCGCAGGA CAGGATCACC CGCGAGATCC AGCGCCGGGT GCGCTCCCTG 
CTGCCCGACC CGGTCCCGAG CAGCGCCGAG GCCGTCACCG GCATGATCCC GGTGATCAGG 
AACGACGAGG TCGGACAGGG CTGA

Protein sequence

MSRSAPLGAP AEARNVLAIT PFRRLWISLS LSSLGDWLSL LALVSLATVF TADGSQLVQY 
LAVSGVVAIK LAPSILLSPL VGSVADRLDR RWTMVVGDVL RAVLYVSIPV VGLLFPGFAL 
EWLLIATLLA EVVALFWTPA KDATVPNLVP RKLLGQANRL SLLTAYGTAP VAALLFAALA 
SVSNVLGAFL PSMASPEADV ALYLNGLTFV VAAVVVAGLP IPRHKPSKDA ESDTRDSGIL 
RALGTGRRHA GGTPRVRGLV PGMLCVVAAG GVVIGVGRVH VEGLGAGNAG FGVVFAAVFA 
GMALGVLAGP RVLKQFSRSR LFGLSIALAG LALLFAGAVA DMVLTAVLTA LLGVGAGIAC 
VIGLAVFDRE VEDEHRGSAF AFLHGAARVT LVGAAVLAPL AAGLIGSYRI PVGPLSYDLR 
GSGLVLMLSG LAVLVVALVC YRRMNRRDDP EAGPGLLPEL FAALRGVAIA PEEDEEARLA 
GAFIVVEGGE GAGKSTQVRE LTVWLRDQGF EVIGTRQPGA TKLGMRLRGL LLDRENSHIT 
PRAEVLLYAA DKADHVQQEI LPALRRGAVV ISDRYVDSLL AYQGSGRDLS SDEIRRISDW 
ATQGLVPDLT VLLDVRPEDG LSRLGGPADR IEGEPAEFHD RVRRGFLELA RAAPERYLVL 
DAREPQDRIT REIQRRVRSL LPDPVPSSAE AVTGMIPVIR NDEVGQG