Gene Ndas_4005 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4005
Symbol
ID	9247877
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	4788900
End bp	4790858
Gene Length	1959 bp
Protein Length	652 aa
Translation table	11
GC content	73%
IMG OID
Product	serine/threonine protein kinase
Protein accession	YP_003681908
Protein GI	297562934
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.599637
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.402473
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCGTCGG ATGGGCTCCC GAAGAACCTG GAACCGCTGG CCGCCGGAGA TCCGGCCACC 
ATCGGTCCCT ACGTGCTGTC CGGGAAGCTG GGTAGCGGCG GCATGGGAAC CGTCTACCTG 
GGCAGCACTC CCGAGCGCAA CAACCAGGTA GCCATCAAGG TCATCCGCCC GGAGCTCGCC 
TTCGACGAGG CGACGCGGGC GCGCTTTCGC GACGAGATGG AGAACGCCCG CAAGGTCGCC 
TCCTTCTGCA CCGCCAAGGT GCTCGACCAC GGGACGTTCG AGAACCGTCC CTACATGGTC 
ACCGAGTACA TCGCGGGCAC CGCCCTGGCC GAGCACATCG CCGAGAACGG TCCGCTGGAC 
TCCTCGACGC TGCACGGCTT CGCACTGGGC GTGGCGGCCG CCCTGGCCGC CATCCACCGC 
ACCGGGCTGG TCCACCGCGA CCTCAAGCCC GCCAACGTGC TGCTGTCGCT CTCGGGGCCC 
CGGGTGATCG ACTTCGGCAT CGCCCGCGCG ATGAACACCG CCACCAACCA CACCCAGACC 
GGCATCGTCA TGGGCAGCCC CGGCTGGATG GCTCCCGAGC AGCTGCTGGA GGAGAAGGTC 
ACCACCTCGG CGGACATCTT CGCCTGGGGC TGCCTGGTGG CCTTCGCCGG GAACGGCACC 
CACCCCTTCG GCAACGGCGA CGCCATGACA TTGGGCAAGC GGGTGCTGTT CGCCGAACCC 
CAGATCGGCA ACCTGATCAG CCCCCTGGAC CGCCTGGTGA CGCGCGCGCT GGCCAAGGAG 
CCGGGCCGCC GCCCCACCGC CCAGGACCTG CTGTTGGAGC TGGCGGGCGG CGAGGACAAC 
AGCAACCCCA ACGACATGGT GTCCCACGCG CTGCACCAGT CGTGGCGGCC CAACCTGCCC 
CCGATGCCCC CGCACGGCAT GCCCCACCCC CAGCAGGGGC CGCACCAGAC CATGGCGGGC 
ATGCGGCACC CGGCGCCCGG CCAGTACCAG GGCGCACCGC CCGCGCCCAT GCCCCCGCCC 
GCGCACCAGA CGGGCAACTA CCCGCGCCCG CAGGGGCCGC CGCCGGGCCA TCCGGCCGGT 
CCCCCGCCGG GGGGCCAGGC GCAGCAGGTG CACCAGGCCC CCGGGGTCCA GGCCCCGGGC 
GGGCAGCCCC AGGGCGGCCC GGTGCAGCAG GCCCGGCCCG TGCCCGGCCC CGCCCAGGCG 
CCGCACCCCG CCTCGACCGG GCCGATCCCG ATGGTCCCCC CGGCCGACCA GCAGACGGGC 
CGCCGGGGTC CGCAGCCCTA CGTTCCGCCG GTGCCGCCGC CACCGCACCA GCCCGCCGCG 
CCCAACCGGC GCAAGGGGAC GGTCGTGGCC CTGGTGCTGG GCGCCGTGGC GCTGCTGGCG 
GCCCTGATCG TCATGGCGAC CGTGCTGACC AACCTCAGCG ACTGGTCGCT CTTCGGGGAC 
GGCGACCCCC AGGGGGACTC CTCCGAGCAG ACGGGCGCCG CCCAGGAACC GCAGGAGCCC 
GCGCCCGGCG ACGAGTCCCC CGGCGGCGCC GACGAGGAGG AGGCGCCCGG CGAGGTGCCC 
AGCGGGATGT CGGGCGCCTC GGCCGACCGC ATGGTCGAGT ACCGGATCCG CGGCGTCAGC 
TGCGGCCTGA CCGAGCACAA CATCCGCTCG GAGCTGCCCT CGACCGGCCA GTACTGCGTG 
GTGGACCTGG AGCTGTTCAA CGTCAGCGAC GAACTGGTGA GGTTCGAGCA CACAGAGCAG 
CAGATGACGA CCAGCGGGGA GCCCGTCAAC GCCCAGGCAC CGTCCGTGCG CGAGGTCGAG 
GCCCCGCTGT GGGACCCGGC CGGGATCAGT CCCGGGGTCG CCGCCGGGGG CGAGCTGGTG 
TTCATACTCC GCGACGACAT GGACCCGCGC ACGCTGGTGC TCAACCACCG GACGGGCGCG 
GAGGCCACGG AGATCAACAT CGAGCACATC GTGGACTGA

Protein sequence

MPSDGLPKNL EPLAAGDPAT IGPYVLSGKL GSGGMGTVYL GSTPERNNQV AIKVIRPELA 
FDEATRARFR DEMENARKVA SFCTAKVLDH GTFENRPYMV TEYIAGTALA EHIAENGPLD 
SSTLHGFALG VAAALAAIHR TGLVHRDLKP ANVLLSLSGP RVIDFGIARA MNTATNHTQT 
GIVMGSPGWM APEQLLEEKV TTSADIFAWG CLVAFAGNGT HPFGNGDAMT LGKRVLFAEP 
QIGNLISPLD RLVTRALAKE PGRRPTAQDL LLELAGGEDN SNPNDMVSHA LHQSWRPNLP 
PMPPHGMPHP QQGPHQTMAG MRHPAPGQYQ GAPPAPMPPP AHQTGNYPRP QGPPPGHPAG 
PPPGGQAQQV HQAPGVQAPG GQPQGGPVQQ ARPVPGPAQA PHPASTGPIP MVPPADQQTG 
RRGPQPYVPP VPPPPHQPAA PNRRKGTVVA LVLGAVALLA ALIVMATVLT NLSDWSLFGD 
GDPQGDSSEQ TGAAQEPQEP APGDESPGGA DEEEAPGEVP SGMSGASADR MVEYRIRGVS 
CGLTEHNIRS ELPSTGQYCV VDLELFNVSD ELVRFEHTEQ QMTTSGEPVN AQAPSVREVE 
APLWDPAGIS PGVAAGGELV FILRDDMDPR TLVLNHRTGA EATEINIEHI VD