Gene Ndas_1740 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1740
Symbol
ID	9245590
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	2111442
End bp	2112575
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	69%
IMG OID
Product	chalcone and stilbene synthase domain protein
Protein accession	YP_003679674
Protein GI	297560700
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.828638
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTCCC GTGTGAACGC ACATCTCGCA ACCGCTCCGG AGAGCCGGGC TCCCGCAGCC 
GCCGACCGTG GCGGAGCCCC CGCGGCGATC GTCGGTGTCG GAACGGCGGT CCCGCCCACC 
TCCTACTCCC AGGACGAACT CCTGGAGATC TTCGACATCC GGGATCCGAG AATCCGCTCG 
GTCTTCCGCA ACAGCGCCAT CGACCGGCGC CACCTCACCC TCCCCCCGGA GGGGCCGGAC 
GGCGGACGGG TCATGGAGGT CCAGGGAGAG CTGCTGGACA AGCACAGGCG GCAGGGTGTC 
GACATGGGAG CCCGCGCCCT CCAGGAGTGC CTGAAGAGGG CGGGGGCCGA CCTGTCCGAC 
ATCGGCTACC TGTGCTGTGT CACCACGACC GGCTTCCTCA CCCCGGGGTT CAGCGCCCTG 
CTCATCCGTG AGCTGGGCAT CCCCTCCAGC GCCAGCCGTC TGGACGTCGT CGGAATGGGC 
TGCAACGCGG GGCTGAACGC GCTCAACGCC GTCGCCGGGT GGGCGCGGGC CCACCCCGGC 
AAGCTCGCCG TCATGGTGTG CATCGAGGCC TGCTCCGCCG CCTACGTGTT CGACGGGACG 
ATGCGCACGT CCGTGGTGAA CAGCCTGTTC GGAGACGGTT CGGCCGCGAT CGCCGTGGTC 
TCCGGCGACA CCGCGGACCG CCCGGAGCCC ACCGGTCCGC GTCTGCTGAA GTTCTCCAGC 
CAGATCATCG TGGACGCCCT TCCCGCCATG CGCTATGACT GGGACTCCGA GCAGGGCCGG 
TTCAGCTTCT TCCTGGACCC CGAGGTGCCC TACGTCGTGG GGGCCCACGC CAACATCATC 
ATCGACCGCC TGCTGGACGG CACCGGGTTG CGCCGCAGCG ACATCCGGCA CTGGACGGTG 
CACTCCGGCG GCAAGAAGGT CATCGATTCG GTCATGGTCA ACCTCGGCCT GACCAGGTAC 
GACGTCCGGC ACACGACGAG CGTGCTCCGC GACTACGGCA ACCTGTCCAG CGGTTCCTTC 
CTGTTCTCGT ACCAGCAGCT CCTGGAGGAG GGCGTCGCCT CCCCCGGCGA CCACGGCGTC 
CTCATGACCA TGGGTCCCGG ATCGACGATC GAGGCAGCGC TGTGCCAGTG GTGA

Protein sequence

MDSRVNAHLA TAPESRAPAA ADRGGAPAAI VGVGTAVPPT SYSQDELLEI FDIRDPRIRS 
VFRNSAIDRR HLTLPPEGPD GGRVMEVQGE LLDKHRRQGV DMGARALQEC LKRAGADLSD 
IGYLCCVTTT GFLTPGFSAL LIRELGIPSS ASRLDVVGMG CNAGLNALNA VAGWARAHPG 
KLAVMVCIEA CSAAYVFDGT MRTSVVNSLF GDGSAAIAVV SGDTADRPEP TGPRLLKFSS 
QIIVDALPAM RYDWDSEQGR FSFFLDPEVP YVVGAHANII IDRLLDGTGL RRSDIRHWTV 
HSGGKKVIDS VMVNLGLTRY DVRHTTSVLR DYGNLSSGSF LFSYQQLLEE GVASPGDHGV 
LMTMGPGSTI EAALCQW