Gene Ndas_3684 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3684
Symbol
ID	9247553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	4422931
End bp	4424046
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	76%
IMG OID
Product	transcriptional regulator, PadR-like family
Protein accession	YP_003681588
Protein GI	297562614
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCA TCTTCGGCCA CGGCAGACTA CGGCTGTACC TGCTCAAGCT GCTGGACGAG 
AACCCGCGGC ACGGCTACGA GATCATCAGC CTGCTCCGCG ACCGCTTCCT CGGCGTGTAC 
TCGCCCTCTC CCGGCACGAT CTACCCCCGG CTGGCCCGGC TGGAGGAGGA GGGGCTGGTC 
ACCCACACCG AGGAGGGCGG ACGCAAGGTC TACAGCCTCA CCGACAAGGG CCGCGAGGAG 
CTGCGCGAGC GCGAGAACGA CCTGAACGAC CTGGAGCGGG AGATCACCGA CTCGGTGCGC 
GACATCGCCC GCGCGGTCAA GCAGGACGTG CGCGCGACGA TCAGCTCGCT GCGCGACGAG 
CTCAAGTTCG CCTCCGGGGG CGCGCGCCGC TCCGGAACCG AGGCCCCGGG CGGACCCGCC 
GGGACCACTG GGACCGCTGG GACCGCCGAC TCCACCGCCT CGGAGGAGGC CGGTCGGAGC 
GAGGAGGGGG CGGACGCGCC CGGGAAGGAG TCCGGCGAGC GCCGCGAGCA GTCCGGGCCG 
GGCTGCGAGG ACGGCTCGCG GTGGTCCCGC GAGTGGGAGC GCTTCACGCA GGGCTTCGGC 
GCGTTCGGCG CCGCCTGGGG AGGCAGGCGC GATTCCGAGC GCCCGTCGCA GGGCCCGGAG 
TTCGAGCGCG CGCTGCACGA CTTCGGCGAC CGCGTGCGCG ACGTGGTCCG CGAGGCGGGA 
CACGTCGGAG AGGCCGCCGC CACCGACCTG CGGCGCATCC TGGACGACAC GGTCGAGGTG 
ATCCGCCGGG ACATGCGGCA CTGGGGCCCG CCCGCCGACC GGGCGGAGGG AGCCGGGGAC 
CGAGTCGACG GGACCGCTCC CGCCGGGGAG GGACCCGCCG CCGCCCCCGG GACGGGGAAG 
GAGGAGCCCG CCGCCACGGA GCGGCCAGGG CCCGCCGAGG ACGAGCCCGG CACGGAGGAG 
CCCGCCGCCA CGGAGGGACC TGCCGCCGCC GAGCGGCCCG GGCCCGCCGG GGACGGGCCC 
GCCGGGGACG GGCCCGCCAC GGAGGGCGGA ACGCGTCCGA GGCCGTCCGC CGATCCCTGG 
AGCGAGGCGG TCGACGACCC CGGCGACGGT AGGTAG

Protein sequence

MSTIFGHGRL RLYLLKLLDE NPRHGYEIIS LLRDRFLGVY SPSPGTIYPR LARLEEEGLV 
THTEEGGRKV YSLTDKGREE LRERENDLND LEREITDSVR DIARAVKQDV RATISSLRDE 
LKFASGGARR SGTEAPGGPA GTTGTAGTAD STASEEAGRS EEGADAPGKE SGERREQSGP 
GCEDGSRWSR EWERFTQGFG AFGAAWGGRR DSERPSQGPE FERALHDFGD RVRDVVREAG 
HVGEAAATDL RRILDDTVEV IRRDMRHWGP PADRAEGAGD RVDGTAPAGE GPAAAPGTGK 
EEPAATERPG PAEDEPGTEE PAATEGPAAA ERPGPAGDGP AGDGPATEGG TRPRPSADPW 
SEAVDDPGDG R