Gene Ndas_0794 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0794
Symbol
ID	9244639
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	975234
End bp	976448
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	70%
IMG OID
Product	Methyltransferase type 12
Protein accession	YP_003678744
Protein GI	297559770
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGCACA GCGAGATCGC CCTCAGGCGG CACGACCTGG CGCTCCGCTC CCGGCAGACG 
CCCGTCGTCC GCGCGGCGCT GGCGGCGGCG AACGGGCTGG GCCTGCGCGG CGGCCCCCTG 
CTCCAGCTCC TCCTCCTGTC CAAGCTCCAG GGGTTCCTCC GGCACATCGT GCTCACCCTC 
ATGGACCGGG AGTTCCCCGA CGGCGACCTG TCCGCGCGCC CGGACACCGA CCCCCGGATC 
CTCGACGACT TCCTCCGGCT CGCCCTGGAG CTGGGCGTCG CCGCACGGGT GGACGGCGCC 
GTCGTCCCCG AACCCGCCTA CACCACCGGG TTCCCCGGCT TCGGCGGCGA CTCGGCCACG 
CGCCCGCGCG CCGAGGCCGA GAAGGACTAC GTGTTCGTCC GAGGGCTCAT CCGCAAGGCC 
GAGGCGGACG GGGAGACCGG GCCGCTCCAC CGACCGGACG TGCGCTACCT GATCGTCCTC 
AGCCGGTACA TCCTCGAACT GGAGGGCATG GGGTTCGACG CCCAGGTCGC GCCCTCCTTC 
TCCGAGAAGT TCTACTCCGA CCTCGGGGCC CTGGCCTACG AGCTCTACAC GAAGCGCTCG 
TTCGAACGGC TCTGCCGCCG CCTCTCCCCC GCGTCCGTCC TGGACATCGG CTGCGGTGAC 
GGCCTGCACA TGAGCTCGGT GCTCTCCACC CTGCCCACCG CACGGATGGT CGGTCTGGAA 
CCCCAGGTGA AGGTCGCCGA CGCCACACGC GAGCGGCTGT CCGGCCATCC GAACACACGC 
GTGGAATCGG TCCGGTTCAC CGACCACGAC ACCACCGACC GCTTCGACAT GGTCCTGAGC 
AGCTTCATGA TCTTCTACAT GCCCGAGGAG GAGCGCGTCC CGTTCTTCCG CAGGGTCCGT 
GAGGTCCTGT CGCCGACGGG CACCTACGTC ATCGGCCAGT ACTTCCCCGA CTTCGAGGAC 
GTCCAGGAGG TCCTCGTGCG CTCGACCTCC CCGGTGCCGG GCATCCAGCT CTACCTGTCC 
GGTGTGGGCA ACTCCCTGGT CAAGGCCGAG GCTCTCCTCA ACCGCGTGCT GTCGGACTTC 
CGGTCGGTGG CCTACTGGAG CACGCTCCAG GACCAGCTCT CGGAGGCCGG CCTGGCCGTG 
GAGGAGATCG TTCCGGCGGA CAGCATGTAC TACTCGTACT TCCTGCTCGT GCGGCGGGCG 
GAGGGCGCCT CGTGA

Protein sequence

MRHSEIALRR HDLALRSRQT PVVRAALAAA NGLGLRGGPL LQLLLLSKLQ GFLRHIVLTL 
MDREFPDGDL SARPDTDPRI LDDFLRLALE LGVAARVDGA VVPEPAYTTG FPGFGGDSAT 
RPRAEAEKDY VFVRGLIRKA EADGETGPLH RPDVRYLIVL SRYILELEGM GFDAQVAPSF 
SEKFYSDLGA LAYELYTKRS FERLCRRLSP ASVLDIGCGD GLHMSSVLST LPTARMVGLE 
PQVKVADATR ERLSGHPNTR VESVRFTDHD TTDRFDMVLS SFMIFYMPEE ERVPFFRRVR 
EVLSPTGTYV IGQYFPDFED VQEVLVRSTS PVPGIQLYLS GVGNSLVKAE ALLNRVLSDF 
RSVAYWSTLQ DQLSEAGLAV EEIVPADSMY YSYFLLVRRA EGAS