Gene Ndas_2049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2049
Symbol
ID	9245899
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	2471216
End bp	2472484
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	73%
IMG OID
Product	metallophosphoesterase
Protein accession	YP_003679981
Protein GI	297561007
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.16685
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCCGCT TCGCCGCCCG ACCCGCCCTC GCCCTGCTCG GCACGACCCT GCTGGCCCTG 
ACCCCGGTCG TCGCCAACGC ACCCGCCGCG TCCGCGGCCA CCGCGCCCGA ACGCGTGATC 
CTCTCGCCCA CGGCCGATCC CGCCACCTCC CAGACCCTCG CCTGGCGCTC GGACGGCTCC 
GGGTCGCCGG TCATGCAGAT CGCCCCCGCC GCCGACCCCG GCCGGGTCAC CACGGTCGAG 
GGCGCCGACA CCGGCTCGGC CAGCGGCACC TTCCACGCGG CCACCGCCAC CGGTCTGACC 
CCCGACACCG CCTACCGCTA CCGCGTCGGC GACGGCACCG CCTTCAGCCC CTGGCGCACC 
TTCACCACCG CGGCCTCCGG CGCCGAACCC TTCACCTTCC TGTACTTCGG CGACGTCCAG 
AACGGCATCT CCACCGGCGG TGCCACGGTG GTGCGTGCCG CCCTGGCCGC CGAACCCGAC 
GCCGAGCTGG TCGTGCACTC CGGTGACCTG GTCGACTCGC CCAACAGCGA GTCGCAGTGG 
ACCGAGTGGT TCGGCGCCTT CGGCCCCGAG GCCACCGGCA CCGTCAACCA CCTCGCCGCC 
CCCGGCAACC ACGAGTACTC GCTGCTCTCC CTGAGCCGGT ACTGGAACCC GCAGTTCCCG 
GGCGCGGGCA ACGGGCCCGC CAGCGGACGC CACCTGCCCC AGACCGTCTA CCACACCGAC 
TACCAGGGCG TGCGCTTCGT CGTCCTCAAC TCCAACTACC GCAACGCGGC GCCGCTGAGC 
GCCGACTCCT GGCTGGACAC CCAGCAGCGC TGGCTGGAGG AGGCCCTGGC CACCAACCCC 
CACCCCTGGA CGGTGGTCAC CTTCCACCAC CCGGTCTTCT CCAACAGCCC CAGCCGCGAC 
AACGGCCCCC TGCGCGACTC CTGGCTCGAC ACCCTGGAGG AGCACGACGT GGACCTGGTC 
CTCCAGGGCC ACGACCACTC CTACGGCCGG GGCAACCTGA CCGCGAACCG CACCGACGAC 
CCCGACGTGC AGACCGGCCC GGTCTACACC GTCGCGGTGA CCGGCACCAA GATGTACGAC 
GCCTCCGCCT CCAACTGGAC CGACAACGGC GCCGAGGTGC GCGTGCAGCT GACCGACACC 
TCCACCTTCC AGGCCGTGGA GGTGGACGGC GCCCGCCTGC GCTACACCGC CCGCACCGCC 
GACGGCGCGG TCGTGGACTC CTTCACCATC GACAAGGGCG ACGGCAAGCG CGTGACCGAC 
ACGCTCTGA

Protein sequence

MSRFAARPAL ALLGTTLLAL TPVVANAPAA SAATAPERVI LSPTADPATS QTLAWRSDGS 
GSPVMQIAPA ADPGRVTTVE GADTGSASGT FHAATATGLT PDTAYRYRVG DGTAFSPWRT 
FTTAASGAEP FTFLYFGDVQ NGISTGGATV VRAALAAEPD AELVVHSGDL VDSPNSESQW 
TEWFGAFGPE ATGTVNHLAA PGNHEYSLLS LSRYWNPQFP GAGNGPASGR HLPQTVYHTD 
YQGVRFVVLN SNYRNAAPLS ADSWLDTQQR WLEEALATNP HPWTVVTFHH PVFSNSPSRD 
NGPLRDSWLD TLEEHDVDLV LQGHDHSYGR GNLTANRTDD PDVQTGPVYT VAVTGTKMYD 
ASASNWTDNG AEVRVQLTDT STFQAVEVDG ARLRYTARTA DGAVVDSFTI DKGDGKRVTD 
TL