Gene Ndas_2345 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2345
Symbol
ID	9246195
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	2795205
End bp	2796479
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	69%
IMG OID
Product	extracellular solute-binding protein family 1
Protein accession	YP_003680273
Protein GI	297561299
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.822896
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.413258
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAACCC CCCGCCTGGG CTCCGCCGCC GGAGCGTCGG CGCTCTGCCT GCTCGCCGTC 
ACCGCCTGTT CCGGTGGCGG CGGCGGAGAC GACCGCATGC ACGTGTGGAT GTACCAGGAC 
ACCCTGGTCG TGGTGCAGGA GGGCGCCGTC GAGAGGTTCA ACGGGGCCTC CGAGACCGAG 
GCGGTCATCG ACGAGGTCCC CGGGGACAGC TACGAGGAGC GCCTGCGCAC GGCGATGGGC 
TCCAGCGAGA AGCCCGACGT GTTCTTCAAC TGGGGCGGCG GCAGCATCGA GCCCTACGTC 
GAGCAGGACA TGCTCGTCCC CCTGGACGAC ATGCTCGCCG AGAACCCCGA GTTCGCCGAC 
TCCTTCATCC CCTCCATCCT GGAGGCGGGC AAGGTCGACG GCGTGCAGTA CGGCATCCCC 
CTGCGCGGCA CCCAGCCGGT CATCCTCTTC TACAACGAGA CGGTGTTCGA GGAGGCCGGA 
GCGGAGCCCC CCGAGACCTG GCAGGACATC CTGGACCTGG TCGACACCTT CACCGAGGAG 
GGCGTCACCC CCTTCGCCCT GGCCGGGGCC GACCCCTGGA CCGAACAGAT GTGGCTCCAG 
TACCTCGTGG ACCGCATCGG CGGACCGGAG GTGTTCGCGC GCATCGTGGA GGGCGACTCC 
GAGGGCTGGC GCGACCCCGC CGTGCTGGAG GCCGCCCGGA TGGTCCAGGA GCTGGTGGAC 
CAGGGCGCGT TCGGCAACTC CTACGCCTCG GTCAGCTACA CCGAGGGCGC GGCCTCGGCG 
CTGCTGTCCG AGGGTCGGGC CGCCATGCAC CTGATGGGCT CGTGGGAGTA CTCCACCATC 
CTGGACCAGA ACGAGGAGTT CGCGACGAAC GACCTCGGGT ACGTGGCGTT CCCGCCGATC 
GAGGGCGGCG AGGGCGACCC CGCCAACGTG GTCGGCAACC CGACCAACTA CTTCTCGGTC 
TCCGCCGAGA CCGAGTACAC GGACCAGGCC ATGGAGTTCC TGACGTACAT GTCCCAGGAG 
GAGTACGTCG CCGACATGGT GGCGAACGGC GAGGTGCCCA CCACCACCAA CGCCGAGGAG 
GTCGTCGCCG ACAGCCCCAG TCCGGACTTC GCCACCTTCC AGTACGAGAT GGTGCGCGAC 
GCGCCGCACT TCCAGCTCTC GTGGGACCAG GCGCTGCCGC CGGAGGTGGC CACGCCGATG 
GTCACCGAGA TCGAGTCGCT GTTCAACGGT GAGAGCACGC CCGAGCAGTT CGTCGACGCG 
CTGGCGGCCC TGTGA

Protein sequence

MRTPRLGSAA GASALCLLAV TACSGGGGGD DRMHVWMYQD TLVVVQEGAV ERFNGASETE 
AVIDEVPGDS YEERLRTAMG SSEKPDVFFN WGGGSIEPYV EQDMLVPLDD MLAENPEFAD 
SFIPSILEAG KVDGVQYGIP LRGTQPVILF YNETVFEEAG AEPPETWQDI LDLVDTFTEE 
GVTPFALAGA DPWTEQMWLQ YLVDRIGGPE VFARIVEGDS EGWRDPAVLE AARMVQELVD 
QGAFGNSYAS VSYTEGAASA LLSEGRAAMH LMGSWEYSTI LDQNEEFATN DLGYVAFPPI 
EGGEGDPANV VGNPTNYFSV SAETEYTDQA MEFLTYMSQE EYVADMVANG EVPTTTNAEE 
VVADSPSPDF ATFQYEMVRD APHFQLSWDQ ALPPEVATPM VTEIESLFNG ESTPEQFVDA 
LAAL