Gene Ndas_5097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5097
Symbol
ID	9248987
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	+
Start bp	239264
End bp	240877
Gene Length	1614 bp
Protein Length	537 aa
Translation table	11
GC content	77%
IMG OID
Product	hypothetical protein
Protein accession	YP_003682984
Protein GI	297564011
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00280261
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.375378
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGACTCA ACCAGTGGAC GGACAACCAC GCGGACGACG GACGCGGCGC CGACGGGCGG 
CCGACGCCAC GGCACGGCCG CGCCTCGCTG CTGCGCCTGG CCGCCTGGTT CGAGGAGGCC 
GACCCGGACC GCGCCGACGC CCTCGCCGCC GCCTCGTACG CCCTCCATCC GGCGCTCCAC 
CTGGAGGGGA GGGTGGACGA GGGTGTCGCC GCGACCACCA GCTGGTGGCA GGCCGACGCC 
GACCGCAGCA CCGTCACCGA GCACCCGGGC GCCCGACCGC CCGAGCCGGT GAGCGACCAC 
CGCGCCCAGC AGGCGCGCCT GCGCGACGCC GCCGAGTCCT CCGCCCACTG GCGCCGCGCC 
GGTGCCGCGC AGATCCGCTC CCTGCTGACC GAGCCCACGG GCCGCCGTGC CCGCCTGGAC 
CTGTCCGGCG CCGGGATGGA GGTCCTGATG GAACTCCTCA CCGCGGCCCT GGGATCCGGC 
GACGCCAGCA GGCGCCCCAC CTCCGCCGGG GACCTGGAGT TCGCGCTGCG CCTGCACGTC 
GTCGCCGCGC CGGGCGCCGA CGTCACCATC CGGGGCGAGG GCGGGGAGCT GACCCTGGAG 
GGGCTGCGCC TGCTGGTGAC CCCCTACGAG CAGCACAGCC CCGGTGTCCT CGACCCGCTC 
CCGGAGGAGC CGGAGGAGGA CGGGGCGGAC CCCCTCGCGG CCGGTGCCCC GGAGGGAGGG 
GACGCTGCCC CGGAGGGGGA GGAGGCCTCC GCCGATTCCC GGACCCCCGT GGACCCGCTC 
GGCCCCGGGA CCGACGAGGA CCTCTCCGAC CCGTCCGAAG AGCCGTCCGA GGACCCGCCG 
GCCCCCGCCG CCCCCGCCGC CTCCGTAAGC CCGGACGCCC CCGCTGACCC CGAGGCATCG 
GTGCTCGCCT CCGTTCCGAC GGCTCCCGAG GACCCTGAGG CTCCGGCAGG CACGTCCGTG 
CCCGGCGGCT CCTTGCCCCC GTTCGATCCG CGGGTCCCTG GCGCACCTGA GAGTGCGCAG 
ACCCCAGACG ATCCGCTGGC CCCCGCCGAC TCTCCGCACT CTGCCGTCGC GGACCGTTCG 
ACGGGCCCGC AAGCCCCTGC TGGCACTGAG GCTCCAACGG CTTCCTCCGC CCCGACAGAC 
ACGAAGAACC CCGAGACCCC AGCGGCCCCT TTCGACCCTC GGCTCCCGAC TGCCTCGGGC 
CGCTCGGCCA GCCCGGGCAC CCCGTCCGCG CCGTTCGCTC CCCGCAACCC CTTCGCCCCG 
GCCGCCTCCG AGGACCCGGA GGCCGCACCG TCCCCGGCCG CACCCCGTAC CCCCCAGACC 
CCGGCCGCGT CGACGGAACC CCTCTTCCCC CAGCCCCCGA CGGTCCCGCC GTACTCCGCG 
CACTCCGACG CCCCGCCCGC CCCGGAGATC CCCGGGACGC CCGCCGCCCC GTCCTACGCG 
GACATCCTGG GGATCCCGGT CCCCTCCGCG ACCCCGGAAC CCTCCCCGGC CCCCGACGCG 
GCGCCCCGCC CCGAGGACAC CGAACCCACG GGTAACCTCC CTGGACCGGA CCCGCGAGCC 
CCCGGTCCGG ACGACCTGTC CGCGAACCCG CCCGAGAAGC CATCGTGGGA GTGA

Protein sequence

MGLNQWTDNH ADDGRGADGR PTPRHGRASL LRLAAWFEEA DPDRADALAA ASYALHPALH 
LEGRVDEGVA ATTSWWQADA DRSTVTEHPG ARPPEPVSDH RAQQARLRDA AESSAHWRRA 
GAAQIRSLLT EPTGRRARLD LSGAGMEVLM ELLTAALGSG DASRRPTSAG DLEFALRLHV 
VAAPGADVTI RGEGGELTLE GLRLLVTPYE QHSPGVLDPL PEEPEEDGAD PLAAGAPEGG 
DAAPEGEEAS ADSRTPVDPL GPGTDEDLSD PSEEPSEDPP APAAPAASVS PDAPADPEAS 
VLASVPTAPE DPEAPAGTSV PGGSLPPFDP RVPGAPESAQ TPDDPLAPAD SPHSAVADRS 
TGPQAPAGTE APTASSAPTD TKNPETPAAP FDPRLPTASG RSASPGTPSA PFAPRNPFAP 
AASEDPEAAP SPAAPRTPQT PAASTEPLFP QPPTVPPYSA HSDAPPAPEI PGTPAAPSYA 
DILGIPVPSA TPEPSPAPDA APRPEDTEPT GNLPGPDPRA PGPDDLSANP PEKPSWE