Gene Ndas_4370 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4370
Symbol
ID	9248245
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	5204160
End bp	5205848
Gene Length	1689 bp
Protein Length	562 aa
Translation table	11
GC content	75%
IMG OID
Product	Uroporphyrin-III C/tetrapyrrole (Corrin/Porphyrin) methyltransferase
Protein accession	YP_003682265
Protein GI	297563291
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACGCCA ACGCCAACCC CCAGCCGGAG GAGCCGCGCG CCGCAGCGCG GGCCGGGCAC 
GTCGCCCTGG TCGGTTCCGG TCCGGGCGGC GCCGACCTGC TCACCCTGCG CGGCGCCGAG 
CTGCTGAGCC ACGCCGACGT GGTCATCACC CTGCGCGAGC CCGCCGCCGA GGAGCTCTCG 
GGCTTTCGCG CCGAACTCCT CTCCCACTGC TCCGAGGACG TCTCCGTGAT CGAGGCGGGC 
GAGTGCGGCG GCGACGTCAA CGCCCTGGCG GTGGCGCGCG CCCGCGACGG GCAGCGGGTG 
GTCCGCCTCT ACTCCGGCGA CCCGTTCTTC GGCTGCCGCG GCGCCGAACT GGTCTCCGCC 
TGCCACGAGG CCGGGGTCGA GGTCGAGGTC GCCCCCGGCG TCTCCGCGAT CACCTCCGTG 
CCGACCTTCG CGGGCGTGCC GCTGCTGGAC GCGGACAGCC CCGAGGTGCG CGTGCTCAAC 
GCCCGCGCGC ACGGCGGGGG AGGGGTCGAC TGGCACGAGG CCGCCGCCAG CGGCGCCACC 
CTGGTCGTCA TGGGCGGCGA CGCGCCCGCC GGTGAGCCGG TCGAGCACCA GGGACCCGGC 
TTCGACGTGC TGTGCAAGAC CCTCATCGCC GGAGGGCGGC CCGCCTCGAC CCCGGTCGCG 
GTCGTGCGCG CGGGCGGCAC CACCCGTCAG ACCACGGTCT CCTCGACCCT GGGGCGGCTC 
GTCGCCGACC TCAAGTCCAA GGACGCCAAG GGCCACCACG TCACCGCGCC CGCGCTGATG 
GTCGTCGGCC CCGCCGCGGG CCGCCACCCC GAGCTGTCCT GGTACGAGAG CCGTCCGCTG 
TTCGGCTGGC GCGTCCTGGT GCCCCGCACC AAGGAGCAGG CCGCGGCCCT GTCCGACCAG 
CTGCGCGGCT ACGGCGCGGT GCCCGAGGAG GTGCCCACCA TCTCCGTGGA GCCGCCGCGC 
ACCCCGCAGC AGATGGAGCG CGCCGTCCGC GGCCTGGTCA CCGGCCGCTA CCAGTGGGTG 
GCCTTCACCT CCGTCAACGC GGTCCGCGCC ATCCGGGAGC GCCTGGAGTC CTACGGCCTG 
GACGCGCGCG CGTTCGCCGG GGTCAAGGTC GCCGTCGTCG GCGAGGCCAC CGCGCGCGCC 
GTGCGCGAGT TCGGCATCCA GCCCGACCTG GCCCCGCCCG AGGAGGAGCA GTCCAGCTCG 
GGCCTGGTCT CGGTGTGGCC GCCCTACGAC GCCGAGATCG ACCCGATCGA GCGGGTCCTG 
CTGCCGCGCG CCGACATCGC CACCGAGACC CTGTCCGCCG GGCTGGACAA GCTCGGCTGG 
GAGGTCGACG ACGTCACCGC CTACCGCACC GTGCGCGCCG CGCCCCCGCC CGCGCCCGTC 
CGGGAGGCGA TCAAGGGCGG CGGCTTCGAC GCGGTGCTGT TCACGTCCTC CTCCACGGTG 
CGCAACCTGG TGGGGATCGC GGGCAAGCCG CACAACACCA CCGTCATCGC CGTCATCGGT 
CCCGAGACGG AGAGGACCGC GATCGAGTTC GGCCTGCGCG TCGACGTCGT GGCGCCCAAA 
GCCTCGGTTT CCGCCCTCGC ACAGGCCCTT TCGGAGTACG GTGCCGAGAA GAGGCGCGAG 
GCGGTCGAGG CGGGCAAGCC CGTCCTCAAG CCCAGTCAGA AGAGACGCGG TCGCCGCCGC 
AAGCTCTGA

Protein sequence

MNANANPQPE EPRAAARAGH VALVGSGPGG ADLLTLRGAE LLSHADVVIT LREPAAEELS 
GFRAELLSHC SEDVSVIEAG ECGGDVNALA VARARDGQRV VRLYSGDPFF GCRGAELVSA 
CHEAGVEVEV APGVSAITSV PTFAGVPLLD ADSPEVRVLN ARAHGGGGVD WHEAAASGAT 
LVVMGGDAPA GEPVEHQGPG FDVLCKTLIA GGRPASTPVA VVRAGGTTRQ TTVSSTLGRL 
VADLKSKDAK GHHVTAPALM VVGPAAGRHP ELSWYESRPL FGWRVLVPRT KEQAAALSDQ 
LRGYGAVPEE VPTISVEPPR TPQQMERAVR GLVTGRYQWV AFTSVNAVRA IRERLESYGL 
DARAFAGVKV AVVGEATARA VREFGIQPDL APPEEEQSSS GLVSVWPPYD AEIDPIERVL 
LPRADIATET LSAGLDKLGW EVDDVTAYRT VRAAPPPAPV REAIKGGGFD AVLFTSSSTV 
RNLVGIAGKP HNTTVIAVIG PETERTAIEF GLRVDVVAPK ASVSALAQAL SEYGAEKRRE 
AVEAGKPVLK PSQKRRGRRR KL