Gene Ndas_3119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3119
Symbol
ID	9246975
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	3733111
End bp	3735156
Gene Length	2046 bp
Protein Length	681 aa
Translation table	11
GC content	72%
IMG OID
Product	serine/threonine protein kinase with PASTA sensor(s)
Protein accession	YP_003681034
Protein GI	297562060
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.417733
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACATGA CGACTTCCGA CCCGCTCGTA GGCGCCACCC TGGACCGACG TTACTTCGTG 
GAGTCCAGGA TCGCCGGAGG CGGGATGGCG ACCGTCTACG TCGCCCACGA CCTGAGGTTG 
GACCGACGGC TGGCCCTGAA GGTGATGCAC CCTTCGCTGG CCCAGGACCC GACCTTCGTG 
CAGCGCTTCA TCAACGAGGC GCACTCCGTC GCCAAGCTCT CCCACCCCAA CGTCGTGCAG 
GTCTTCGACC AGGGTGAGGA CCAGGGGCAC GTGTTCCTGG CCATGGAGTA CGTACCCGGA 
CGCACCCTGC GCGACCTGCT CAAGTCCCGG GGCAGGCTCG GCGCCCACGA CGCCCTGAAC 
GCCATGGCCC CGGTGCTGGC CGCGCTCGGC GCCGCCCACC AGGCGGGCAT GGTGCACCGC 
GACGTCAAGC CCGAGAACGT CCTCATCACC GAGGACGGCC GGGTCAAGGT CGCCGACTTC 
GGCCTGGCGC GCGCCGTGGA GCAGTCCAAC CAGGGGCTGA CCCGCACGGG CACCCTCATG 
GGCACGGCGG CCTACCTGGC CCCCGAGCAG ATCGAGAAGG GCGTCGCCGA CGCCCGCAGC 
GACGTGTACG CGGCGGGCAT CATGCTCTAC GAGCTGCTCA CCGGCAGCCA GCCGCACACC 
GGCGAGACGC CCATCGCGAT CGCCTACCAG CACGTCAACG AGGACGTCCC GCGCCCCTCG 
CACTTCCTGC CCGGCCTGCC CGCGGAGGTC GACGCGCTGG TCACCAAGGC CACCGAGCGC 
GACCCCAGGT ACCGTCCCAG CAACGCGGGC CAGTACCTGG CCAAGGTCCT GGCGGTGCTC 
AACGGCCTGC CCGCGTCTCC CCCCGCCTCC GCCGCCGACC AGGCCCCGCT GACGCCCGTC 
GCCCCGGCGG CGGCGGCCAC GGCCTCGGTG ACCGCGCCCC AGCTCATCGC CGGGGGCGCC 
GGTCCCGGCA CCGAGAACGC GACCATGGTC GTGGACATGG CCTCCGCCGG CCTCGACGAC 
GGCCGCTACG ACGACTACGA CCGCGACAAG GACGGATACG GCGACGACGG GTACGACGAC 
TACCGGAACG GCCCCGACGA CCGGCGCCGC CGCAACCTGC TGATCGGGAT CGGCGCGGCG 
GTCCTGGCGC TCGTCCTGCT CGGCGCGGGC TGGTGGTTCC TGGTCGGCCA GTACGAGAAC 
GTCCCCGACG TGGTGGGCCG CGACCCCGAG GCCGCGAGCC GGATCATCCG CGACGAGGGC 
CTGCGCTACG ACCTGTCCTC CGAGGCCGTC TACAGCGACG CCGAGCCGGG CACGGTCGGC 
GAGACCGACC CCGAGGTGGG CGCCCGCCTG TCCCCCGACG ACGTGGTCAC CGTGTACCTG 
TCCAAGGGCC CGCAGACGGT GGAGATGCCC GACCTGGTCG AGATGGACGC CGCCAACGCG 
CTCAAGGAGC TGGAGGACCT GGGCTTCGTC CCGGACAACA TCGTCCAGGA GGACGTGAGC 
TCCACCGAGG TCGAGCCCGG CGCGGTGGTC TCCACCTCCC CCGAGGCGGG CGCGGAGGCC 
GACCGGGAGG AACCGGTCAC CCTCACCGTC AGCCGGGGCA TCCCGGTGCC CGCGGTGGTC 
GGCGAGGACC TGGACACCGC CCGCCAGATG CTGGAGGGCG AGGGCCTGTC CGTCGAGGTG 
GTCGAGGAGG AGAGCGCGGA CGTCGAGGAG GGCAGGGTCA TCCAGCAGAG CCCCGACAGC 
GGCTCCAGCA TCGGCTCCGG CGGCACCGTC ACCCTGACCG TCTCCACCGG TCCGCCCGGC 
GTGGACATCC CCGACGTGGT CGGCATGCGG GTCGACGACG CGCGCGAGGC GCTGGAGGAG 
GCCGGTTTCA AGGTCAAGGT CGAGCGCGTC TTCGGCGGCC GCGAGGTGGC GCACCAGTCG 
CACACCGGCA GGGCTCCCGA GGACACGGAG ATCACGATCA CCGCGACTCC GGGCGGCATC 
GACCTGGGCG ACTTCGGCAA CGGCAACGGC AATGGCAACG GCCGCGGCGA CGACGATGAC 
GACTGA

Protein sequence

MDMTTSDPLV GATLDRRYFV ESRIAGGGMA TVYVAHDLRL DRRLALKVMH PSLAQDPTFV 
QRFINEAHSV AKLSHPNVVQ VFDQGEDQGH VFLAMEYVPG RTLRDLLKSR GRLGAHDALN 
AMAPVLAALG AAHQAGMVHR DVKPENVLIT EDGRVKVADF GLARAVEQSN QGLTRTGTLM 
GTAAYLAPEQ IEKGVADARS DVYAAGIMLY ELLTGSQPHT GETPIAIAYQ HVNEDVPRPS 
HFLPGLPAEV DALVTKATER DPRYRPSNAG QYLAKVLAVL NGLPASPPAS AADQAPLTPV 
APAAAATASV TAPQLIAGGA GPGTENATMV VDMASAGLDD GRYDDYDRDK DGYGDDGYDD 
YRNGPDDRRR RNLLIGIGAA VLALVLLGAG WWFLVGQYEN VPDVVGRDPE AASRIIRDEG 
LRYDLSSEAV YSDAEPGTVG ETDPEVGARL SPDDVVTVYL SKGPQTVEMP DLVEMDAANA 
LKELEDLGFV PDNIVQEDVS STEVEPGAVV STSPEAGAEA DREEPVTLTV SRGIPVPAVV 
GEDLDTARQM LEGEGLSVEV VEEESADVEE GRVIQQSPDS GSSIGSGGTV TLTVSTGPPG 
VDIPDVVGMR VDDAREALEE AGFKVKVERV FGGREVAHQS HTGRAPEDTE ITITATPGGI 
DLGDFGNGNG NGNGRGDDDD D