Gene Ndas_0501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0501
Symbol
ID	9244342
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	618506
End bp	619603
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	75%
IMG OID
Product	Domain of unknown function DUF2394
Protein accession	YP_003678454
Protein GI	297559480
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.569038
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGCGAAT CGGCGGACAG CTCGGTGGAC GGCAAACGGC TCCTGCTGGT GGGCACCTAC 
ACCCCCGACT CCGACCCTCC CGGGGAGGGC GAGGGGATCT ACCGCGTCTG GTTCGACCCC 
ATGACCGGCG AGATGACCCA CGGCGGCGCC GCCGCCCGTA CCCCGGGCCC CTCCTTCCTC 
GCCTTCCGCG AGGACCCGCC CACGGTCTAC GCGGTCAACG AGCGCGAGAA GGGCACCGTC 
ACCGCCTTCC GGATCGACGG CGCAGCCGGG CTCACCGAAC TTGGCCAGTC CCCGACCGGC 
GGCGGGTCGC CCTGCCACGT GCTCGCGCGC GGCTCCGAAC TGGCGGTGAC CAACTACGCC 
AACGGCGTGG CCACGCTGTA CGCCCTGGCC GAGGACGGCT CCCTCGACGG AACGGCGGCG 
GAGTTCGCGC ACTCCGGAAG CGGCCCGGTC ACCGACCGCC AGGAGGGGCC GCACGCGCAC 
AGCACCGCCG CCCCCGACGA CCATCACCTG CTGGTGGCCG ACCTGGGCAC CGACGAGCTG 
CGCGTCCTGC GCGGCGGCGA GGAGGTCGGC GCCGTCTCCC TGCCCCCGGG CACCGGCCCC 
CGGCACACGG CCGTCCTCGG CGAGTACCTC TACGTAGCGG GTGAGCTGGA CTCGCGCGTG 
CACGTCCTGC GATGGAACCC CGACGAAGGC ACCGCCGAGC ACCTGGGCTC CGTCGAGGCC 
ACCGGAGAGG AGGCCGCAGG CGAGAACTTC CCCGCCGAGA TCCTCAGCAA CGGCGACCAC 
GTGTACGTGT CCAACCGGGG CGCGGACACG ATCGCCACCT TCGCCGTCCG CGACGGCGGC 
GCCCGTCTGG AGCACGTCGC CGACACCCCG GCCGGAGGGC CGTGGCCGCG CAACTTCACC 
GTCGTGCGCG GCCACCGCGA GGAACCCGAC CACCTGGTCG TGGCCGCCCA GAACGGCGGC 
TCGCTGGCCT CGCTTCTCCT GGACCCCGGC ACGGGCGTCC CGGCCGACAC CGGCCACCGG 
CTGCGCCTGC CCGTCCCCGT GTGCGTGCTC CCGGTCCCGA TCACCCGCAT CCGCCGCGCC 
GGGGGAACCC GGGGCTGA

Protein sequence

MGESADSSVD GKRLLLVGTY TPDSDPPGEG EGIYRVWFDP MTGEMTHGGA AARTPGPSFL 
AFREDPPTVY AVNEREKGTV TAFRIDGAAG LTELGQSPTG GGSPCHVLAR GSELAVTNYA 
NGVATLYALA EDGSLDGTAA EFAHSGSGPV TDRQEGPHAH STAAPDDHHL LVADLGTDEL 
RVLRGGEEVG AVSLPPGTGP RHTAVLGEYL YVAGELDSRV HVLRWNPDEG TAEHLGSVEA 
TGEEAAGENF PAEILSNGDH VYVSNRGADT IATFAVRDGG ARLEHVADTP AGGPWPRNFT 
VVRGHREEPD HLVVAAQNGG SLASLLLDPG TGVPADTGHR LRLPVPVCVL PVPITRIRRA 
GGTRG