Gene Ndas_0233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0233
Symbol
ID	9244067
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	289976
End bp	291178
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	78%
IMG OID
Product	DNA protecting protein DprA
Protein accession	YP_003678189
Protein GI	297559215
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACACGG ACACGACGGA GGAGAGCGGG GGGACGGTGC GGGACGCGGA GGACGAGGCG 
GACGCGCGGG CGCGGGCCTG CCTGACAGCG GTGGCCCCGC CGGGGGACCT GTGGCTGGGG 
GCGATGCTCG CCGAGCACGG CGCGGAACGG GTGTGGGCGC TGCTGGCGGC GGGGGCGCAC 
CCGCCGCCGG TGCCTGTCGA AGCCGGGGAG GACGGCCCGG GACCGGAGGC GCAGACCCTT 
CTGGAACGCA GGTGGGCGCG GTGGGGCGCC GCGGCGCGGG CGGTGGACCC CGACGGGCTG 
CTCGGCGACT CGGCGGCGGC CGGCATCCGC TTCGTGGCCC CGCGGGACCC CGAGTGGCCG 
GGCCGCCTCG ACGAACTGGA CCTGCCCGGA GGGCGGCGCT CGCACGGACT GTGGGTACGC 
GGCGCGGGGG ACCTGCGTCA CCTGTGCCTG CGCTCGGTGG CCGTGGTGGG CGCGCGCTCG 
GCCACGCCCT ACGGGGAGCA CGTGGCGGCG GAGATGGCCT ACGAGCTGGC CGAGCGCGCG 
GTCGTGGTGG TCTCCGGCGG CGCCTACGGG ATCGACGGGG CCGCGCACCG GGCGGCCCAG 
GCCCACGGCG GCACGGTCGT GGTGCTGGCC TGCGGGCTGG ACGTGGACTA CCCGCGCGGG 
CACGCGGGCC TGTTCGCCGA CGTCGCCCGC ACCGGGGTGC TGGTGAGCGA GCGGCCGGTG 
GGCGCCACCC CGCGCGCACC GGACTTCCTC GTACGCAACC GGCTGATCGC CGCGCTCACC 
CCGGGCACGG TGGTGGTGGA GGCCGGACGG CGTAGCGGTG CCCTCAACAC CGCCTCGCAC 
GCGGCCGAGC TCAACCGGGC GCTGATGGCG GTCCCCGGCC CGGTCACCTC GGCGATGTCG 
GTGGGCTGCC ACCTGCTGCT CCGAGACTGG AACGCGAGCT GCGTCACCTG CGCGGACGAC 
GTCGTCGCCC AGGTGAGCGC GCTGGGTGAG CTGCCGCCGG AGTCCGGGCC GCTGCGGGTG 
TCGGCCGAGC TCGACCAGGA CAGCGCCCGC GTCCTGGCGG CGGTGCCCAG GTCCGGCGCC 
GGGCCCGCGG TGATCGCCGT GGCCAGCGGG ACCCGTCTGG AGAGGACCCT GCGCTCCCTG 
GGGATGCTGG CCGCGGCCGG ACTGGTGGAG CGCTGTCCGT CGGGCTGGCG GCTGCCGCAG 
TGA

Protein sequence

MNTDTTEESG GTVRDAEDEA DARARACLTA VAPPGDLWLG AMLAEHGAER VWALLAAGAH 
PPPVPVEAGE DGPGPEAQTL LERRWARWGA AARAVDPDGL LGDSAAAGIR FVAPRDPEWP 
GRLDELDLPG GRRSHGLWVR GAGDLRHLCL RSVAVVGARS ATPYGEHVAA EMAYELAERA 
VVVVSGGAYG IDGAAHRAAQ AHGGTVVVLA CGLDVDYPRG HAGLFADVAR TGVLVSERPV 
GATPRAPDFL VRNRLIAALT PGTVVVEAGR RSGALNTASH AAELNRALMA VPGPVTSAMS 
VGCHLLLRDW NASCVTCADD VVAQVSALGE LPPESGPLRV SAELDQDSAR VLAAVPRSGA 
GPAVIAVASG TRLERTLRSL GMLAAAGLVE RCPSGWRLPQ