Gene Ndas_1159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1159
Symbol
ID	9245009
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	1413019
End bp	1414674
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	72%
IMG OID
Product	protein of unknown function DUF187
Protein accession	YP_003679106
Protein GI	297560132
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGACCCCTG AACGACGAGC CGGCCTCTCA CCGCGCTGGC GCTCCCGGTG GGTGGCCGCG 
GCCGCCGCGT CGGGGCTCAT GATCTCCGGA TACGCCCTCG TCGGCGCGGC CCACTCCCCC 
ACCGGGTCCT TTCCCGGCCC CGGCGCGGCC GGTTGCGAGG CCGCCCAGGA CAAGCGGCAG 
ATGCGCGGGG CGTGGCTGAC CACGGTCGGC AACATCGACT GGCCCTCCGA GCCGGGCCTG 
TCCGCCGAGG ACCAGAAGGC GGAGATGGAC CAGCGCCTGG ACGAGGCGGT GGACCTCGGC 
CTGAACACCG TGTTCCTGCA CGTGCGGCCC ACCGCCGACG CCGTCTACGA GTCGGACCTG 
GAGCCGTGGT CGAAGTACCT CACCGGCGAG CAGGGCGGCG ACCCCGGCTA CGACCCGCTG 
GAGTACGCGG TGGCCGGAGC GCACGAGCGC GGCCTGGAGC TGCACGCCTG GTTCAACCCC 
TACCGGGTCG GCATGGACTC CGACATCGAG GAGCTGGCCG AGGACCACCC GGTCAGGGAG 
CACCCCGACT GGCTGGTGCG CTACGGCGGC GAGGGCTTCC TGGACCCGGG CAGGCCCGAG 
GTCCAGGAGT GGGTGACCCG CGTGATCATG GACGTGGTGG AGCGCTACGA CATCGACGGC 
GTGCACTTCG ACGACTTCTT CTACCCCTAC CCCAAGGACG GCGAGGAGTT CGACGACGAC 
CGGACGTGGG AGGAGTACGG CGACGGCTTC GAGGACCGCG AGGACTGGCG GCGCGACAAC 
GTCAACGGCT TCGTCAGCGG TGTGCACGAG CGCATCGAGG AGGCCAAGCC CTGGGTGCGC 
TTCGGGATCT CCCCGTTCGG CATCTGGCGC AACGCCGAGA ACGACCCCGC CGGGTCCGAC 
ACCTCGGGCC TGGAGTCCTA CGAGGCCCAG CACGCCGACA CCCGCGCCTG GATCCGGGAG 
GGGATGGTCG ACTACGTCGT CCCGCAGCTG TACTGGGAGC GGGGCTTCGA CGCCGCCGAC 
TACGAGGAGC TGCTGCCGTG GTGGGCCGAG CAGGTCGAGG GCACGGACGT GGACCTGTAC 
GTCGGCCAGG GCGCGTACCG GGTCGGTGAC CGCAACTGGA CCGACGAGGA CGCGCTGAGC 
ACCCAGCTGG ACTACTCCTC CGACCACCCC GAGGTCGACG GCGACGTCTA CTTCTCCTTC 
AAGTCCCTGA CAGGCGTGGC CGAGGAGGCC TACGCCCACC TGGCCGACGA GCACTACGGC 
GACCCCGCCC TGCCGCCCCT GGCGGGAGGG GACCGCGGAG GCCGGTCCCT GGCGGGCGCC 
GTGGAGGACG TGACCGCCGA GGTCGCGGAC GAGCACACCG CGGTGGAGTG GGAGCGGGTG 
GAGGACGCGC GCTTCTACGC CGTCTACCGC CTGGACGCGC AGGAGGCCGC GCGGGCGGAC 
TCGGGCGACC CGGAGGAGTA CTGCGGCGTG CTCTCCTCCG ACAACCTCGT GGGCGTGACC 
GGCGGGACCT CGCTGGAGGA CTCCGGCCAC ACCGCCGAGG ACGCCGCGAA GGCCGAGGAG 
AACGGTGAGG AGTCCGGTTC CGCGTACGTG GTGACGGCGC TGGACGACTA CAGGGTCGAG 
GGGCCCGTGA GCGAGGTCGC CGACCCGCGC GGCTGA

Protein sequence

MTPERRAGLS PRWRSRWVAA AAASGLMISG YALVGAAHSP TGSFPGPGAA GCEAAQDKRQ 
MRGAWLTTVG NIDWPSEPGL SAEDQKAEMD QRLDEAVDLG LNTVFLHVRP TADAVYESDL 
EPWSKYLTGE QGGDPGYDPL EYAVAGAHER GLELHAWFNP YRVGMDSDIE ELAEDHPVRE 
HPDWLVRYGG EGFLDPGRPE VQEWVTRVIM DVVERYDIDG VHFDDFFYPY PKDGEEFDDD 
RTWEEYGDGF EDREDWRRDN VNGFVSGVHE RIEEAKPWVR FGISPFGIWR NAENDPAGSD 
TSGLESYEAQ HADTRAWIRE GMVDYVVPQL YWERGFDAAD YEELLPWWAE QVEGTDVDLY 
VGQGAYRVGD RNWTDEDALS TQLDYSSDHP EVDGDVYFSF KSLTGVAEEA YAHLADEHYG 
DPALPPLAGG DRGGRSLAGA VEDVTAEVAD EHTAVEWERV EDARFYAVYR LDAQEAARAD 
SGDPEEYCGV LSSDNLVGVT GGTSLEDSGH TAEDAAKAEE NGEESGSAYV VTALDDYRVE 
GPVSEVADPR G