Gene Ndas_4180 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4180
Symbol
ID	9248054
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	4990947
End bp	4992443
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	75%
IMG OID
Product	methyltransferase small
Protein accession	YP_003682081
Protein GI	297563107
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.385541
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCTGAGA CGAGATTTCC GCGCGGTCTG GCCGAGCGAC TCCGCGGCAT CCTCATCGAC 
GCCGACTACA CCGTGTCCGG CGTCCGCGAC CGCCTCGGCG ACGCCGCCGC GCGCGCACTG 
GCCCGCGAGG AGCTGGTGCC CGCCCTGCGC GCCACCGGCG GCGACGAACG GCTCGGACTG 
CTGCTGCGCC TGTGGTGGCT GCGGTCGTCC ATCCCCGCGC GCGCCGCGCG TTCGATCCTG 
CCCGTGGACG AGCTGGCCGA GGCCGGTCTG GTCACCGTGG AGGAGGGGCA GAGCGGGCCC 
GTCGTGCGCG CCCTGGTGCA CCTGGGCCCC TGGGAGCTGG AGGACGGCAG GCCCGGGTTC 
GTGGTCTCCG ACCCCAAGGT GCGCCCCGGC AGCGGCGCGG TCCCCGCTCC CGACCACGTG 
GTGGGTGCGG GCGGCGCCTC CTCCACCCTG TCCCAGCTGA TCGTGGACGG ACCGGTGGAG 
CGCGCCCTGG ACGTGGGCAC CGGCTGCGGG GTGCAGGCCC TGCACCTGGC CTCGCGGGCG 
CGCGAGGTGG TGGCCACCGA CCTCAACCCG CGCGCCGTGC GCCTGGCCGG GATCAGCCTG 
GCCCTGTCCG GGGTCACCGA CGCCCGCCTG GAGCAGGGTT CGCTGTACGA ACCGGTCGCG 
GGCGAGCGCT TCGACCTGAT CGTGTCCAAC CCGCCGTTCG TGATCACCCC CGACTCCTCC 
CGGTACACCT ACCGGGAGTC GGACCTGCCC GGCGACACCG TGTGCGCCGA GCTGGTGCGA 
CAGGCCCCGG CGCACCTGAC CGAGGGCGGC TGGTGCCAGA TCCTGGCGAA CTGGGTGCAC 
CGCGACGGCG ACGACTGGGA GGACCGGGTC GGCGGCTGGG TGACCGGGAC CGGGTGCTCG 
GGCTGGGTGG TCCAGCGCGA CGTGCAGGAC CCCGCCGAGT ACGTGGAGCT GTGGCTGCGC 
GACTCCTGCG AGCACGGCAC CCCCGAGTAC ACCCGCCGCT ACGACGCCTG GCTCGACTAC 
TTCGAGCGCG AGGGCATCAA GGGCATCGGG TTCGGGTGGA TCTGCCTGCG CAACGACGTC 
GCCCAGGACG CGACCGTGCG CGTGGAGGAG CTGCGGCACG AGATCGAGCG GCCCGTGGGC 
CCCTACCTGC CCGACGTGGT GGACGGGGCG ATGACCGCGC TGCGCCTGAC CGACGCGGCG 
CTGCTGTCCG CGCACGTGGC GCTCGCGCCG GGCGTGGTGG AGGAGAGGGT GGGGCGCCCC 
GGCGCTCCGG ACCCGGAGAA GATCCTGCTG CGCCAGCGCG ACGGCCTGCG GCGCGTGGCC 
CGCGTGGGGA CGGTGGAGGC CGCCCTGGCG GGGGTGTGCG ACGGCACCAT GCCGGTCGGC 
CCGCTGCTGA ACGTCATCGC CGAGCTCATC GGCGAGGACC CCGCGCTGGT GCGCGAGCGC 
ACGCCCGACG CGCTGCGCAC CCTCATCGCG GAGGGGTTCT TCCGGGTGGC CCGCTGA

Protein sequence

MSETRFPRGL AERLRGILID ADYTVSGVRD RLGDAAARAL AREELVPALR ATGGDERLGL 
LLRLWWLRSS IPARAARSIL PVDELAEAGL VTVEEGQSGP VVRALVHLGP WELEDGRPGF 
VVSDPKVRPG SGAVPAPDHV VGAGGASSTL SQLIVDGPVE RALDVGTGCG VQALHLASRA 
REVVATDLNP RAVRLAGISL ALSGVTDARL EQGSLYEPVA GERFDLIVSN PPFVITPDSS 
RYTYRESDLP GDTVCAELVR QAPAHLTEGG WCQILANWVH RDGDDWEDRV GGWVTGTGCS 
GWVVQRDVQD PAEYVELWLR DSCEHGTPEY TRRYDAWLDY FEREGIKGIG FGWICLRNDV 
AQDATVRVEE LRHEIERPVG PYLPDVVDGA MTALRLTDAA LLSAHVALAP GVVEERVGRP 
GAPDPEKILL RQRDGLRRVA RVGTVEAALA GVCDGTMPVG PLLNVIAELI GEDPALVRER 
TPDALRTLIA EGFFRVAR