Gene Ndas_1391 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1391
Symbol
ID	9245241
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	1707126
End bp	1708169
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	76%
IMG OID
Product	Pectinesterase
Protein accession	YP_003679329
Protein GI	297560355
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.161325
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00169458
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGTCCGCC GCAGTTCCCC CGCCGCCCCC GGAGCGGAGG GCCGGGTGAT CACCGTGGCC 
GCCGACGGTT CCGGCGACCA CACCGGGGTC CAGGCCGCGA TCGACGCCGT GCCCGCGGGC 
GGCGACGAAC GCGTCACCAT CCGCGTCGGG GCGGGCGTCT ACCGCGAGCC GGTGGTGGTT 
CCCGCGGACA AACCCGGGAT CACCCTGCTC GGCGCGACCG GCGACCCCCG GGACGTGGTC 
CTCACCTACG ACCGTGCGGC GGGCACCCCC GGGCCCGGCG GGGGCGTCCA CGGCACGTCC 
GGCAGCGCCA GCGTCCTCAT CTCCGGGGAC GGCACGCACG CCCGCGACCT GACCTTCGCG 
AACTCCTGGC TGCGCGAGGA GCACCCCGGC GTCACCGGAA CCCAGGCGGT CGCGCTGCGC 
GCCACCGGGG ACCGGCTGGT CTTCGACAAC GTGCGCTTCC TGGGCCACCA GGACACGCTG 
TACGCGGACT CGCCGGACGC GGACACCCCC GCGCGGCAGT ACTACCGCGG CTGCTACGTC 
GAGGGCGACG TGGACTTCGT CTTCGGCCGG GCCACGGCCG TGTTCGACGG GTGCGTGTTC 
CACTCCCTGG GCCGGGGCAG CGACACCGAC AACGGCTACG TGACCGCGCC GAGCACCCGG 
CCCGGCCGGG AGTTCGGCTT CCTGGTCACC CGCGGCCGCT TCACCGGTGA CGCCCCCGCC 
GGGACCGTCT ACCTGGGCCG CCCGTGGGTG CCCAGCTCGC ATCCGGACGC CGAGCCGCGG 
GTGCTGGTGC GCGACTCCTG GATGGGCCGC CACTTCCGCG GGGAGGGCTG GATCGCGATG 
GCCTCCGGCC ACGACTGGCG CCGGTTCCGG ATGCTGGAGT ACCGCAACTC CGGTCCCGGC 
GCGCTGGTCA CCGCGGACCG ACCGCAGATG GACCCGACCG AGGCCGCCCG GCACACCATT 
GAGGCCTACC TGGCCGGGGA CGACGGGTGG AACCCGGCGC GGGAGCGCAC GGGGCGCCCG 
GAGTCCGCCA CCCGGGCACG CTGA

Protein sequence

MVRRSSPAAP GAEGRVITVA ADGSGDHTGV QAAIDAVPAG GDERVTIRVG AGVYREPVVV 
PADKPGITLL GATGDPRDVV LTYDRAAGTP GPGGGVHGTS GSASVLISGD GTHARDLTFA 
NSWLREEHPG VTGTQAVALR ATGDRLVFDN VRFLGHQDTL YADSPDADTP ARQYYRGCYV 
EGDVDFVFGR ATAVFDGCVF HSLGRGSDTD NGYVTAPSTR PGREFGFLVT RGRFTGDAPA 
GTVYLGRPWV PSSHPDAEPR VLVRDSWMGR HFRGEGWIAM ASGHDWRRFR MLEYRNSGPG 
ALVTADRPQM DPTEAARHTI EAYLAGDDGW NPARERTGRP ESATRAR