Gene Ndas_0036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0036
Symbol
ID	9243863
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	46154
End bp	48034
Gene Length	1881 bp
Protein Length	626 aa
Translation table	11
GC content	75%
IMG OID
Product	serine/threonine protein kinase with PASTA sensor(s)
Protein accession	YP_003677994
Protein GI	297559020
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.202905
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGGGGGA ATAGAATCCG TGCCATGGAG ACCCCCACTC CCGATCCCCT CTTCGGCATC 
ACGCTGCACG AGCGCTACAT CCTCGGAAAG CGGCTGCGCA GCGGCGCCTC GGGAACCGTC 
CACGTCGCAC ACGACCTCGG CGGCGACCAG ACCGTCACGG TCACCGTGCT GCACCCCTGG 
CTGGTGGGCG ACCACGGTGC CGTGCACGCG TTCCTGGACC GCGCCCAGAC CCTGGAGGGC 
CTGTCCCACC CGGGGATCGC CCGGGTCCTC GGCCACGGCC GCGACGGCGA GCACGTGTAC 
GCGGTCGGCG AGTACCTGTC GGGGCACACC CTCGCGGAGG CGCTGGGCGA GGGCGGCGGG 
GGGCTGCGCT ACCCGGTGCA GGCGGCGCTG GCCATCGTGG CCGGGGCGCT CACCGCGCTC 
GACGCCGCCC ACGGCGCGGG CGTCGTGCAC GGCGCGCTCG ACCCCCACAC GGTCGTGGTG 
GACGGTGAGG GAGGGGTGCG GGTCACCGGT TTCCCCCTGC TCTTCGACGC CGAGGAGGAC 
GCCGGTCCCG AGACCCGTAC CGACGTGCAC GCCGTCGGGC GGCTCCTGTA CACGCTGTTG 
ACCGGGGTGC CCGCGGACCC GGAGGCCCGG CCGCTGCGGC CCTCGGCCGT CATCCCCGGC 
CTGCCGTCCG ACCTGGACAT GCTGGTCGCC AACGCCACCG ACCCCAACCC GCGCTACCGC 
CCGCGCGACG CGGGCCAGTA CCTCACCGTG GTCGAACAGG TGCTGCGGTC GCTGTCCGGG 
GCCCCGGTGA ACCCCGCCGA CGTCGACACC CGGCCCATCC CGGTGATCAC CGACGCCCCG 
CCGGAGCGAG GGGAGGAGCG CGCCGCACCG GTCCCGCCGT GGCGGCGCGT CCCCGTGCTG 
GTCACCGCGG GCGTCCTGGT CCTGGTCCTG TTCGCGGCCG GGTGGGCGCT GGTCCCGGAC 
GACCGCGTCG CGCTGCCCGA CCTCGTGGGC GCCTCCAGCG AGCAGGCCGA GGAGCGGCTG 
GCCGGGCTCG GCATGGACCT GGCCGTGCGC TTCGAGGACG CCTACAGCGA CACCGTCGGA 
GCCGGAGCGG TCGCCGACAG CACGCCCGCG CCCGGCAGCG ACGTGGCGCG GGGAGCCGAG 
GTCCTGCTGC ACGTCTCCAC CGGGCCGCGG TACTCCGGGG TTCCCGACGT GGTCGGCGGC 
ACCGAGAACG AGGCGCGCGA GACCCTGCGC CAGGCCGGGT TCACCGGTAT CGAGATCGTC 
CAGGAGCACT CCCCCGACCA GCCCCCGGGC ACCGTCCTGT CCACCGAGCC CGCGGCGGGC 
GAGGAGGGCG ACCGCGAGGA GCCGGTCGTG CTCAGCGTGA GCGAGGGCGT CATCGTCCCC 
ACGCTGATCG GCATGGGCCA GGAGGAGGCC GCGACCGCCC TGGCCGGGCT CGGCCTGGTC 
GTACAGGTCA CCGAGGAGCA CCACGACACC GCGCCCGTCG GCGAGGTCAG CGGGCAGACC 
CCCGAACCCG GCACGATCCT GCCGGAGGAG GCCGCCGTCT CCCTCACCGT CTCCCTCGGC 
CCCGAGCCGG AGGAGGAAGA GGAGGAGTCC GAGGAGGAGG CCTCCCCCTC CGACGAGGAC 
GACCCCCGCG TCGACGAGGG GGAACAGGAC GGCCGGGGCG ACCAGGACGG CTGGGGCGGC 
CGGGGCGATG ACGACGACGA CCGCGGACGC GGGGACGGCG GCGGCTCCTG CGACGCCCCG 
CAGTGGAACG GGGGCACCGT GTACGACACC GGTGACCGCG TCCAGCACGA TGGCCGTGAG 
TACGAGGCGC GCTGGTGGAT CCAGGGCTAC CCGCCGAGCG GCGACCAGTG GGGCGTGTGG 
GAGGACAAGG GCTCCTGCTG A

Protein sequence

MRGNRIRAME TPTPDPLFGI TLHERYILGK RLRSGASGTV HVAHDLGGDQ TVTVTVLHPW 
LVGDHGAVHA FLDRAQTLEG LSHPGIARVL GHGRDGEHVY AVGEYLSGHT LAEALGEGGG 
GLRYPVQAAL AIVAGALTAL DAAHGAGVVH GALDPHTVVV DGEGGVRVTG FPLLFDAEED 
AGPETRTDVH AVGRLLYTLL TGVPADPEAR PLRPSAVIPG LPSDLDMLVA NATDPNPRYR 
PRDAGQYLTV VEQVLRSLSG APVNPADVDT RPIPVITDAP PERGEERAAP VPPWRRVPVL 
VTAGVLVLVL FAAGWALVPD DRVALPDLVG ASSEQAEERL AGLGMDLAVR FEDAYSDTVG 
AGAVADSTPA PGSDVARGAE VLLHVSTGPR YSGVPDVVGG TENEARETLR QAGFTGIEIV 
QEHSPDQPPG TVLSTEPAAG EEGDREEPVV LSVSEGVIVP TLIGMGQEEA ATALAGLGLV 
VQVTEEHHDT APVGEVSGQT PEPGTILPEE AAVSLTVSLG PEPEEEEEES EEEASPSDED 
DPRVDEGEQD GRGDQDGWGG RGDDDDDRGR GDGGGSCDAP QWNGGTVYDT GDRVQHDGRE 
YEARWWIQGY PPSGDQWGVW EDKGSC