Gene Ndas_1394 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1394
Symbol
ID	9245244
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	1709628
End bp	1710809
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	78%
IMG OID
Product	transcriptional regulator, CdaR
Protein accession	YP_003679332
Protein GI	297560358
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.684667
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0014878
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGGACACG AACAGCGTGC CCGGGTCGGC GCCGAGCTGG CGCGGGAGCG GGCCGGGCTG 
GTCGAGCGCA TCGTCGCCGA GGTGCACGCC GAGGTCCCGG CCTACCGCGC GCTGCACGGG 
TCCCAGCTCA CCGAGGTCCG GGCGATCACC GGGTGGCTGA TGGGCCGCTC ACTGGAGCTG 
TGGGCGGCCG GGGCGACGCG GCTGCCGCCG GAGGACGTGG AGCGGCTGCG CGGCATCGGC 
CGGTCCCGGG CGGCCGACGG GCGTTCGATC GGCGCGGTGG TGCGCGCGCA CCGGGTGGGC 
TCGGCGGCGG CGGTGCGCCT GGTCGCCGAA CTCGCCTCCG ACCGGCTCGA CGCCGCCGAC 
GTGTTCGCCC TGGGCGAACT GTGGCTGACC TCGATCGACC AGATCTCCGA GAGCCTGTCC 
GCGGGCCACG CCGAGGCCGC GCGCCGCCTG GACGCGGACC TGGAGCGGGC CCGCCGGGCC 
TTCCTGGACG ACCTGCTGAT CGGACGGCAG GCCTCGCGCG GGGCCATCCG CGACCGGGCG 
CGGACCCTGG GCATCGCCCC GCCCGACCCG GCGGTGCTGG TGGTGGCCGA GGCCGACGGC 
GGCCCCTGCG ACGGGGCGCC GCGGTCGGCC GCGCTCGCCG CCGGGATGGA ACTGCTGGGC 
CTGGTGGAAC CGGCGGGCGC CGACCCGCTG GTGACCACGC GCTCGGGACG CGTGGTGCTG 
CTGGTCCGCC CCGACGACGC CGACCGGGTG GCCGCCGTGC TCGGCGGACG CCCCTGGCGC 
GGGTGCGTGC TGGAGCCGCG CGCGCTGACG GACATGTCGG CCGCCTACCG GCTGGCCGAC 
GGCGCCCTGG AGACCGCACC CGCGCACGCC TTCGACTCCC GGGGGCTGCT CGGGACCTCC 
GACGCGTGCG TGCTGGCACT GCTCAACGGC GGCCCGGTCG CCCCGGCCGC GGTCCGCCGC 
ACGGTGCTGG GGCCGCTGCT GGCCGAGGGC AACGCCCACC TGCTGGAGAC GCTGCGGGCC 
TACTTGCGCG AGGGCGCGGC GACCACGGCC GCGCAGGCGC TGCACGTGCA CGCCCAGACG 
CTGCGCTACC GGCTGCGCCG GGTGCGGGAG CTGACCGGGC ACGACCCGCA CCGGCCCTGG 
CAGCGGTTCG TGCTGGAGAC CGCCTGCGCG ATCGCGCCCT GA

Protein sequence

MGHEQRARVG AELARERAGL VERIVAEVHA EVPAYRALHG SQLTEVRAIT GWLMGRSLEL 
WAAGATRLPP EDVERLRGIG RSRAADGRSI GAVVRAHRVG SAAAVRLVAE LASDRLDAAD 
VFALGELWLT SIDQISESLS AGHAEAARRL DADLERARRA FLDDLLIGRQ ASRGAIRDRA 
RTLGIAPPDP AVLVVAEADG GPCDGAPRSA ALAAGMELLG LVEPAGADPL VTTRSGRVVL 
LVRPDDADRV AAVLGGRPWR GCVLEPRALT DMSAAYRLAD GALETAPAHA FDSRGLLGTS 
DACVLALLNG GPVAPAAVRR TVLGPLLAEG NAHLLETLRA YLREGAATTA AQALHVHAQT 
LRYRLRRVRE LTGHDPHRPW QRFVLETACA IAP