Gene Ndas_3431 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3431
Symbol
ID	9247298
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4105121
End bp	4106401
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	76%
IMG OID
Product	uroporphyrin-III C-methyltransferase
Protein accession	YP_003681342
Protein GI	297562368
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.447049
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.196927
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTATC TCCTTGGTTT GCGCATGCGG GGACGCGACG TCCTCGTCGT CGGAGGGGGC 
AGGGTCGCCC AGCGGCGCGT CCCCGTGCTC ATCGAGGCCG GGGCCCGCGT CACCCTCGTC 
TCCCCCGAGG CCTCGGCGGC CCTGGAGGAC CTCGCCTCGG CCGGACGCCT CACCTGGCAC 
CGGCGGCCCT ACGCCCCCGG CGACGTCGCG GGCCCGGACG CCCCCGCCCA CTGGCTCGTG 
CACGCCGCCA CCGACGACCC CCGCGTCAAC GCCGCCGTCG CCGAGGAGGC CGAGAACGCC 
CGCGTGTGGT GCGTGCGCGC CGACGACCGC CACGCCTCCT CCGCCTGGAC CCCCGCCAGC 
GGCAGCGCGG CCGGGGTCAC CGTGGGCGTC GTCGCCTCCG GAGACCCCCG CCGCTCGGCC 
GGACTGCGCG ACGCCGTCGT CGACGGCCTC GCCGACGGCA CCCTCGACGC CCGCCGCGGA 
CGCGAGCGCC TGCGCGGCGT CGCGCTCGTG GGAGGAGGTC CCGGCGACCC CGGCCTGATC 
ACGGTGCGGG GACAGCAGCT CCTCTCCCAG GCCGACGTGG TGGTGGTCGA CCGGCTCGCC 
CCCACCTCCC TCCTGGACCG CCTGCCCGCC GACGTCGAGA TCGTCGACGC CGCCAAGATC 
CCCTACGGCC GGTCCATGAC CCAGGAGGAG ATCAACGCGA CCCTGGTCGA CCGCGCCGGA 
CGCGGGAAGT TCGTGGTGCG GCTCAAGGGC GGCGACTCCT TCCTCTTCGG CCGCGGCGGC 
GAGGAGGCCG CCGCCTGCGC CGCCGCGGGG ATCCCCGTCA TCGCCGTGCC CGGTGTGACC 
AGCGCGCTCG CCGCCCCGGC CAGCGCGGGC ATCCCCGCCA CCCACCGCGG CGTGGCCCAG 
GACCTGCACA TCGTCTCCGC GCACGTGCCC CCCGGGGACG GGCGCTCCAC GGTCGACTGG 
GCCGGACTCG CCCGCGCGGG CGGTACCGTC GTCGTCCTCA TGGGGGTGGA GCGGATCGAG 
GCGATCGCCG AGGCCCTCGT CTCCCACGGC AGATCCGCCG ACACCCCCGT GGCGGTGGTA 
CAGGAGGCCA CACTGCCGGG GCAGCGGACC GTCACCGGTA CGCTGGCCAC CATCGCCGCC 
GCGGCCCGAT CGGCCGGAGT GCGGCCCCCC GCGGTGGTGA TCATCGGAGA AGTGGTCAAA 
ACAGCGCGGG ATCTTGACAT ACTGCACACG GGAAACCAGT TCGAGACCCG TCGACTGGCG 
ACCGGGCGCG ATCTCCAGTG A

Protein sequence

MTYLLGLRMR GRDVLVVGGG RVAQRRVPVL IEAGARVTLV SPEASAALED LASAGRLTWH 
RRPYAPGDVA GPDAPAHWLV HAATDDPRVN AAVAEEAENA RVWCVRADDR HASSAWTPAS 
GSAAGVTVGV VASGDPRRSA GLRDAVVDGL ADGTLDARRG RERLRGVALV GGGPGDPGLI 
TVRGQQLLSQ ADVVVVDRLA PTSLLDRLPA DVEIVDAAKI PYGRSMTQEE INATLVDRAG 
RGKFVVRLKG GDSFLFGRGG EEAAACAAAG IPVIAVPGVT SALAAPASAG IPATHRGVAQ 
DLHIVSAHVP PGDGRSTVDW AGLARAGGTV VVLMGVERIE AIAEALVSHG RSADTPVAVV 
QEATLPGQRT VTGTLATIAA AARSAGVRPP AVVIIGEVVK TARDLDILHT GNQFETRRLA 
TGRDLQ