Gene Ndas_1461 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1461
Symbol
ID	9245311
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	1788782
End bp	1790464
Gene Length	1683 bp
Protein Length	560 aa
Translation table	11
GC content	72%
IMG OID
Product	Ricin B lectin
Protein accession	YP_003679398
Protein GI	297560424
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.851115
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.229288
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCCATCA ACCCCCCGCT TCCCCCCGGC GCGCCCCGGA CCGCTCCGCC GTCCTCCCCG 
CCCTCCCGCA GACAGCTCTC GCGCCTGTCG CGCCTGCGGC GGCTCCTGTA CTCCGCCCTG 
GCCGTCGTCC TCTGCGCGAG CGGCCTCTCC GCCGCCGCCG TCACCCCCGC CCGGGCCGCC 
GACATCGACA CCGGCGCCTA CTACGTCCTG CGCAACCAGC ACAGCGGCCT GGTCGCCGAC 
GTCGAGAGCG CCGGAACCCA GGACGGCGCG CGGATCATCC AGTGGGAACG CACCGACCGC 
CCCTGGCAGC AGTTCCGCTT CGTCCCCTCC GGCGACGGCT ACTACCGCCT CGTCAACCGC 
CACAGCGGTA AGGCCGTCGA CGTCTGGGAG CACTCCACCG CCAACGGCGC CGAGATCCGC 
CAGTTCACCG ATCTCGGCAA CGCCAACCAG CAGTGGCGCC CCGTGGACAC CGGCGGCGGC 
GTCCAGCTGA TCAACCGCCT CAGCGGCAAG GCCCTGGAGG TCTGGGAGTG GAGCACCACC 
CCGGGCGACC GCCTGTCGCA GTACGACTCC CTCGGCGGAG CCAACCAGGT CTGGGACCTG 
GTCCGCGTGG ACGACACCGG CGGTGGGGGA GACGGCGACT GCGGCAGCGG CTCCCACCAC 
GCCGAAGCGG TGCGGAACGG CTCCACCTGG ACCGCCCGCA ACGGCGGCAG CACCGTCTAC 
ACCGGCGGCG ACATGCTCGC CGCCATGCGC GCGGCCGTCG GCAGCCTCGA CTCCGGCCGC 
ACCTCCCAGC AGCGCGTGGT GGTGCGCGGA TCCGGTTCCA TGCCCGCCAA CACCTCGCTC 
GACCTGCCCA GCCACACCTC ACTGGAGGTC TGCGGCACCA TCCACGTGTC CGGGTCGGTG 
GGCGCCGACC ACGCCGCCGT CCGGATCCGC AACGCCCAGA ACGTCTCCGT CCCCCACCTG 
TCCGTGACCG GCTCGCCGTA CTTCGGCGTC TTCGTGCGCG GCTCGCAGAA CGTCCACTTC 
GGCCAGATCG ACCTGCGCCT GTCCAGCGGC CTGGGCATGC GCATCGACAG CCGGGGCAGC 
GACGCCAACC GCACCACGCG CGACATCAGC ATCAACGACG TGTACGTGTC GGGCACCGAC 
AACCACGGCG TGGAGACCTA CAGCGTGGAC GGCCTGGACA TCGGCACCGT CACGGCCCGC 
GACACCGGCT ACTCGGGCCT GCTGCTCAAC AACACCGTCA ACGCCACGGT GGACCGGGTG 
GACGCCGAGG GCGCCGGGAC CGGAACCGGC TACGCGGCCT TCCGCATGGC CAACCGCAAC 
GGGCGGATCG GCAGCGACTA CCCGACCAAC ATCCGGGTCG GCGAGGTCCG GGCCCGCGGC 
GGCGGCCGGG GGGTCTTCTG CGTCTCCGAG AGCGGCGGCG CGGTCATCGA CCGCGTGGAC 
ATCGCCCAGA CCGGCAACAA CGCGGTGCTG GTCGAGAACT GCCACAACGT CACCTTCTCC 
GGGGGCACGA TCGCCGGTCC GGGCAGCGTC CGGATCGCGG CCCGCTCGGA GTTCGCCAAC 
ACCTCGAACG TCACGTTCCA GAACCTGACG CTGGCCAACA CCTCACTGGT CGAGAACCCG 
TGCTCGGTGA ACCTGACCGT CCGCAACGTC ACCTTCCAGA GCAGCAGCGA CCAGACCTGC 
TGA

Protein sequence

MPINPPLPPG APRTAPPSSP PSRRQLSRLS RLRRLLYSAL AVVLCASGLS AAAVTPARAA 
DIDTGAYYVL RNQHSGLVAD VESAGTQDGA RIIQWERTDR PWQQFRFVPS GDGYYRLVNR 
HSGKAVDVWE HSTANGAEIR QFTDLGNANQ QWRPVDTGGG VQLINRLSGK ALEVWEWSTT 
PGDRLSQYDS LGGANQVWDL VRVDDTGGGG DGDCGSGSHH AEAVRNGSTW TARNGGSTVY 
TGGDMLAAMR AAVGSLDSGR TSQQRVVVRG SGSMPANTSL DLPSHTSLEV CGTIHVSGSV 
GADHAAVRIR NAQNVSVPHL SVTGSPYFGV FVRGSQNVHF GQIDLRLSSG LGMRIDSRGS 
DANRTTRDIS INDVYVSGTD NHGVETYSVD GLDIGTVTAR DTGYSGLLLN NTVNATVDRV 
DAEGAGTGTG YAAFRMANRN GRIGSDYPTN IRVGEVRARG GGRGVFCVSE SGGAVIDRVD 
IAQTGNNAVL VENCHNVTFS GGTIAGPGSV RIAARSEFAN TSNVTFQNLT LANTSLVENP 
CSVNLTVRNV TFQSSSDQTC