Gene Ndas_3460 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3460
Symbol
ID	9247329
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4148636
End bp	4149796
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	63%
IMG OID
Product	hypothetical protein
Protein accession	YP_003681369
Protein GI	297562395
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCGGACA CAGAACGTCA GAAGGACCAG AACGAGAACC GCCTTACGGT CGGCGTGATC 
GCTGATCCCG TCGCCATGCC AGCTTTGATC GGGGAACAGC TCGCTCAGGA CCTTCCACAG 
TTGTTGACTC AACAAGTCGA CTCAGAACAA ACCTGGGCCG CCCAGGTGCA CTGGGAACGC 
CTCCCGCCCA GCGATAGCCG CCACACGGCG ATGATGGAGC TCGCCGAGAC CAAGTTGGCC 
GAGCACGGCT GGGACATGGT CGTATGCGTG ACCGACCTGC CCATGCGCAG CGGCAAGCGA 
GTGATCATGG GTGACATGAA CAGCCAGCGG CGCGTAGTCG TGGTCTCGTT ACCGGCCTTC 
GGGGTCATGG CGCTGCGGCG CAGGGTCGGT GCGGTAGTGG CTCAGCTCGT CGCTGATATG 
CACAGACCCG GGGCTCCCCA AGAGGGGACC GCACCACACG CACGAAACCG CATCCCCCTA 
CTAGCGGCGC GTTTTCGGCG TCACACCCCC GACCAGGCCG GAGTCGATGC CCGGATCTCC 
TCCAAGTGGG GGAATCTGCG TTTGTTGTTG GGGATGGTAC GAGCCAACCG GCCCTGGCGC 
CTGACCTGGA GCTTAACCAG CCCGCTGGTC GGTGCCTTTG CCTTCAGCGC ATTCTATTTG 
CTCAACGCCA CAGTTTGGGA GATCGCGACC ACTTTGTCAG CCTGGCGCCT GGCCCTTGCG 
GCAATGGGAG CGCTGTCGGT GATGACTGGA TGGCTCATCG TTTACCACAA CTTGTGGGAA 
CCGGTGAGGG CGCGCCCCCG CGACGAGCGC CAACAGGCGG TGCTGTTCAA CGCGACGACG 
GTACTGACCT TGGGCCTCGG AGTAGCTTTT TTGTATGTGG GCCTGTATCT GGTCAACTTG 
ACAGCGGCGC TGGTATTGCT CTCGCCAGGG GTTCTGGATT CGTACATCGC TGGCCAAGCG 
AGCGCGGGCA CCTATGTGCT GATCCCTGTG CTGGTGACGG CGGCGGCCAC GGTGGCAGGT 
GCGATCGGGT CCGGTTTCGA GAGCGAGGAG TCGGTGCGCA ACGCCGCCTT CAGCCGGCGC 
GAACGGGAGC GGCGCGAGGC TTTCCGAGAA AGGCACGAAC AGCGCCAAGG ATCTCTACAA 
GAACGCGGAG AGGCTTCCTG A

Protein sequence

MPDTERQKDQ NENRLTVGVI ADPVAMPALI GEQLAQDLPQ LLTQQVDSEQ TWAAQVHWER 
LPPSDSRHTA MMELAETKLA EHGWDMVVCV TDLPMRSGKR VIMGDMNSQR RVVVVSLPAF 
GVMALRRRVG AVVAQLVADM HRPGAPQEGT APHARNRIPL LAARFRRHTP DQAGVDARIS 
SKWGNLRLLL GMVRANRPWR LTWSLTSPLV GAFAFSAFYL LNATVWEIAT TLSAWRLALA 
AMGALSVMTG WLIVYHNLWE PVRARPRDER QQAVLFNATT VLTLGLGVAF LYVGLYLVNL 
TAALVLLSPG VLDSYIAGQA SAGTYVLIPV LVTAAATVAG AIGSGFESEE SVRNAAFSRR 
ERERREAFRE RHEQRQGSLQ ERGEAS