Gene Ndas_0651 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0651
Symbol
ID	9244493
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	799671
End bp	801113
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	72%
IMG OID
Product	RNA modification enzyme, MiaB family
Protein accession	YP_003678602
Protein GI	297559628
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.455802
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.358579
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCATCGC GCCGTACTGT CTCACTCGTC ACCCTGGGGT GTGCGCGTAA CGAGGTCGAC 
TCCGAAGAGC TGGCCGGGCG CCTGTCCGCT GGCGGCTGGG ACCTCGTCGA GGGCGACACC 
GAGGCCGACG TCACCATCGT CAACACCTGC GGGTTCATCG ACGCGGCCAA GCAGGACTCC 
ATCGAGACCC TCCTGGAAGC GGCGGAGAAC GGCGGCAGAG TCGTCGCCGC CGGGTGCATG 
GCCGAGCGCT ACGGCTCCGA GCTGGCCCAG GCCCTGCCCG AGGCGCAGGT CATCGGATTC 
GACGACTACG CCGCCATCAC CGACCGGCTC GACGACGTCG TGGCCGGGCG GACCCTGGTC 
CCGCACGACC CCCGCGACCG GCGCACGCTG CTGCCGATCA GCCCGGCCGA GCGCGACGCC 
TCCCAGGCCC ACGTCCCCGG CCACGCCAGC TTCGCCGAAT CCGCCGGGGC CGAGGGCACC 
GAGCTGCCCT ACCGCGCCTC CGTCCCGCGC CGCCGCCTCG TCGGCGGACC GGTGGCCAAC 
CTCAAGATCG CCTCCGGCTG CGACCGGCGC TGCACCTTCT GCGCCATCCC GACCTTCCGG 
GGGGCCTACC TCTCCCGCCG CCCCGACGAC ATCGTGCGCG AGGCCGAGTG GCTGGCCTCC 
GAGGGCGTGC GCGAGGTGTT CCTGGTCAGC GAGAACTCCA CCTCCTACGG CAAGGACCTG 
GGCGACGTGC GCGCCCTGGA GAAGCTCCTG CCCCGCCTGG CCGCAGTCGA GGGCCTGGAG 
CGGGTCCGGG TCAGCTACCT CCAGCCCGCC GAGGTCCGCC CCGGCCTGGT GGACGTGCTC 
ACCGGGACCC CCGGCGTGGT GCCCTACTTC GACCTGTCCT TCCAGCACGC CAGCGGCACC 
CTGCTGCGCC GCATGCGCCG CTTCGGAGAC CGCGAGCGCT TCCTGGAGCT GCTGGACACG 
GTCCGCAAGC GCGCGCCCGA GGCGGGCTCG CGCTCCAACT TCATCGTGGG CTTCCCCGGT 
GAGACCGAGG CCGAGTTCGA GGACCTGGTC TCCTTCCTCT CCGAGGCCCG GCTGGACGCC 
ATCGGCGTGT TCGGCTACTC CGACGAGGAG GGCACCGAGG CCTTCGGCCA CGAGGGCAAG 
CTGCCCGACG AGGTCGTCGC CGAGCGCGTG GACCGGCTCA ACCGCCTCTC CGAGGAGCTG 
ATGACCCAGC GCGCCGAGGA GCGGATCGGT TCGGAGGTCA CCGTCCTGGT GGAGACGGTG 
CTGGAGGACG GCGCCTACGA GGGCCGCGCC GAGCACCAGG CACCCGAGGT GGACGGCAGC 
ACGATCCTCT ACGGCGAGGG CCTCGCCGTC GGCGACCTGG TGCGCGCCAC CGTCATCCAG 
TCGGCCGGGG CCGACCTCAT CGCGGAGCAG GACGACACCC ACGGGGAAGC CGCGGACAGA 
TGA

Protein sequence

MSSRRTVSLV TLGCARNEVD SEELAGRLSA GGWDLVEGDT EADVTIVNTC GFIDAAKQDS 
IETLLEAAEN GGRVVAAGCM AERYGSELAQ ALPEAQVIGF DDYAAITDRL DDVVAGRTLV 
PHDPRDRRTL LPISPAERDA SQAHVPGHAS FAESAGAEGT ELPYRASVPR RRLVGGPVAN 
LKIASGCDRR CTFCAIPTFR GAYLSRRPDD IVREAEWLAS EGVREVFLVS ENSTSYGKDL 
GDVRALEKLL PRLAAVEGLE RVRVSYLQPA EVRPGLVDVL TGTPGVVPYF DLSFQHASGT 
LLRRMRRFGD RERFLELLDT VRKRAPEAGS RSNFIVGFPG ETEAEFEDLV SFLSEARLDA 
IGVFGYSDEE GTEAFGHEGK LPDEVVAERV DRLNRLSEEL MTQRAEERIG SEVTVLVETV 
LEDGAYEGRA EHQAPEVDGS TILYGEGLAV GDLVRATVIQ SAGADLIAEQ DDTHGEAADR