Gene Ndas_3748 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3748
Symbol
ID	9247617
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	4500844
End bp	4502058
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	77%
IMG OID
Product	hypothetical protein
Protein accession	YP_003681652
Protein GI	297562678
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCCA CCGCTCCCCC GGCCGCGCCC CCGCGCTCCC CCGGCCGCGC GCCGTCCCGG 
GAGGACTCGC GCGTCCTGCG GGTGTGGCGC TCGGTCCGGG TTCCGGCAGC CGTGGTGGCC 
GCGCTCGTCA CGGTCTCGGT GCTGCTGTCG CTGGGCAGCG AGCAGTTCCC CACCGGCCAC 
CTGGAGCCCG GTTCCATCGA CCCGGACGGC ACGCGGGCGC TGGTGAACGT GCTGGAGGAG 
GACCGCGACG TGCACGTGGT GCGCTCCTCC GCCGCCGCGG AGGAGGCCGT GGCCGACGCC 
GGGGACGACG CCGTGCTCGC GGTCTTCCTG GACCACCGCC TGCTCCCCGA GGAGCTGGAC 
TCGCTGGCCG CGCTCGACGT GGACACCGTC CTGGTGCAGC CGTCCACGCG GTCCCTGGAG 
GCGTTCGCCC CCGGGGTGAC GATGACCGGC CGGGAGGAGC CCGAGGGGTT CCCCACGCCG 
GAGTCCCCCT ACGCCCCCGA GTGCGGGCTG TCGGCCGCCG AGGCCGCGGG CGAGGCCTAC 
GTCGCCGGTG AGCTGTACAC GGCCGGTTCC GGCGCGGACG CCGTGGGCTG CTACCCCGGT 
GGCGGCGGCG ACGCCCTGGT CCGGGTGGAG CGGGACGGGG CCGCCACGAC CGTGCTGGGC 
ACCGGCAGGC CGCTGACCAA CACCGCGCTC TCCGCCGGCG GCAACGCCGC GCTGGCGATG 
AACCTCCTGG CCGCCGAGGA CGTGGTGTGG CTGCGCCCCG ACCCGCCCCA GCAGGAGGGC 
GGCTCCGGGC TGTGGCAGCT GCTGCCGCTG GGCCTGCGCT GGTCCCTGGT GCCGCTGGTG 
GCCGCGTTGG CGCTGCTCGC CCTGTGGCAG GGGCGCCGGA TGGGCGCCCT GGTGCCCGAG 
TCGCTGCCCG TGGTGGTGCG CGCCTCGGAG ACCACCGAGG GGCGTGCGGG ACTGTACCAG 
TCGCGCAGGG CCCGGGACCG GGTCGCGGCC GCGCTGCGGT CGGGGTTCGT GGACCGGGTC 
GCACCCAAGC TCGGGCTGGG CGCGGACGCC GCGCCCGACA CGGTCGTGGC GGCGGTCGCC 
TCGCGGACCG GTGACGACCC CGCCCACCTG CGGGCCCTGC TCCACCCCGG GCAGCCCGAC 
CCGTACGCGG GCGACGACGA CATGCTGGTC AGGCTCGCCG ACGAACTCGA CGAGCGCGCC 
CGGAGGCTCC GGTGA

Protein sequence

MTATAPPAAP PRSPGRAPSR EDSRVLRVWR SVRVPAAVVA ALVTVSVLLS LGSEQFPTGH 
LEPGSIDPDG TRALVNVLEE DRDVHVVRSS AAAEEAVADA GDDAVLAVFL DHRLLPEELD 
SLAALDVDTV LVQPSTRSLE AFAPGVTMTG REEPEGFPTP ESPYAPECGL SAAEAAGEAY 
VAGELYTAGS GADAVGCYPG GGGDALVRVE RDGAATTVLG TGRPLTNTAL SAGGNAALAM 
NLLAAEDVVW LRPDPPQQEG GSGLWQLLPL GLRWSLVPLV AALALLALWQ GRRMGALVPE 
SLPVVVRASE TTEGRAGLYQ SRRARDRVAA ALRSGFVDRV APKLGLGADA APDTVVAAVA 
SRTGDDPAHL RALLHPGQPD PYAGDDDMLV RLADELDERA RRLR