Gene Ndas_4650 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4650
Symbol
ID	9248532
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	5524443
End bp	5525507
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	76%
IMG OID
Product	transcriptional regulator, MerR family
Protein accession	YP_003682542
Protein GI	297563568
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.637642
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCTGATCG GTGACGTGGC CCGCCGCTCC GGGGTGAGCA CCCGGATGCT CCGCCACTAC 
GACGCCCTGG GGCTGGTGAG GCCGACGGGC CGTACCGCCG GCGGCTACCG CGAGTACTCC 
GACGAGGACG TCCGCAGGAT CTTCCAGGTG GAGAGCCTGC GGACCCTCGG GCTCTCGCTC 
CGGCAGATCG GGCGGGCTCT GGAGGACCCG GCCTTCACAC CGTCAGCCCT GGTGGACGAC 
CTCATCCGGT GGACGCAGGA GCGGTTGGCC CGGGAGCGGG AACTGCTCGA CCGGCTCCGC 
GCGATCGACG CGTCGGAGCC CGCCGACTGG CAGGACGTCC TGAGCGTCGT CGAGCTCATG 
CGGGGGCTCG ACGCGACCAG CGCCGCGCGC AGACAGCAGG CCGTCCTGTC CCGGCCGGGG 
GACGCGTCGG CTTCCGCCGA ACTGCTGGCC GGGGCGGTCC TGACCGAGTC CGACCCCCAC 
GTCGCGGGCG CCCTGCGCTG GGCGCTCGCC CGGTCGGGCG GCGACGGCGT GGCGACTCTG 
GCGGCCGGTG CGCGGTCGCA GGACCCCGAC GTCCGGCGGC GCGCGGTGCT GGCGGTCGCC 
GGGATGCCAG AGGCCCCGGA GGTCACCGCG GTGCTCGCGG ACGCTCTCGG GGACCCGGAC 
CCCGTGGTGC GCGGGCACGC CGCCCTGGCC CTGGGCGGGT ACGGCGCGGC CGAGGCCGTA 
CCCGCGCTGG TCGGCATGGT GGTCGACGGC TCCAGGGACG TGGAGGCGGC GGAGGCGCTG 
GGAGGACTGT CCCGGGACCC CGGGTGCGCG GACCGGATCA CGACCGCCCT GGCCGACGAA 
CTCGCCGCAC CCGGCGCGGA CTCCGCGACA CGGATCCGTC TCGTCCAGGC GCTGGTCGAG 
ATCGGGGGAG CCGCCGTGCG CGGGATCCTG GACCGACTGA CCCGGGACGA GGACCGCGCC 
GTCGCCCTCG TCGCCTCGGC CCTCGCCGGG ACCCTCCGGG AGCGGTCCCC CGAGGAGGAC 
CGGTCCCTCG GGGAAGGGGA GGACCGGGCC GACGGGGACC CCTGA

Protein sequence

MLIGDVARRS GVSTRMLRHY DALGLVRPTG RTAGGYREYS DEDVRRIFQV ESLRTLGLSL 
RQIGRALEDP AFTPSALVDD LIRWTQERLA RERELLDRLR AIDASEPADW QDVLSVVELM 
RGLDATSAAR RQQAVLSRPG DASASAELLA GAVLTESDPH VAGALRWALA RSGGDGVATL 
AAGARSQDPD VRRRAVLAVA GMPEAPEVTA VLADALGDPD PVVRGHAALA LGGYGAAEAV 
PALVGMVVDG SRDVEAAEAL GGLSRDPGCA DRITTALADE LAAPGADSAT RIRLVQALVE 
IGGAAVRGIL DRLTRDEDRA VALVASALAG TLRERSPEED RSLGEGEDRA DGDP