Gene Ndas_1249 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1249
Symbol
ID	9245099
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	1551450
End bp	1552919
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	75%
IMG OID
Product	phosphoesterase PA-phosphatase related protein
Protein accession	YP_003679194
Protein GI	297560220
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.195733
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.362635
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCGAC TCCAACGGGC TGACAAGAAG GTCTACGACC ACGTGACGGG GTTGGGACCC 
GCGTCCCTGG ACGCCTACAC CCCCAAGTTC GTGCAGGCGA CGGACAACAT GGCGCCGTGG 
TTCCTCATGT CGGCCACCCT CGCCGCCACC GGCGGCCCCA GGCTGCGGCG CACCGCCCTG 
CGCGCCATCC TGGCCGCGGG CACCGCCAAC CTGGTCTCGG CGGGGATCAA GCAGATCTCG 
GGGCGCACCC GCCCGGACAA CTCGGCCGTC CCGGCCGCGC GCAGCCCCTA CCGCTCCTAC 
CCGAGCACCT CCTTCCCCTC CGGGCACACC GCCGCGGCCG CGGCCTACGC GGCCGGGGTC 
ATGACCGACG CGCCCAAGCC GCTGGCCGGG CTGGTCGCCC TCCTGGCGGG CGGGGTGGCG 
TTCTCCCGCG TGCACAGCGG CGTCCACTAC CCCGGCGACG TGCTCGCCGG AGTGGCCATC 
GGGTGCGGCG CGGCCCTGCT CGCCGGAACG GTGGTGCCGC CCCGGCCCGA ACTGGTCTTC 
GGCGCGCGCA CCGTCGCCGA CGGGGAGACC GACGTGGACC GCGAGGGCGG CGGGGTGACG 
GTGGTGGTCA ACCCGCGCTC GGCCTCGGGC ACGGTGCCCG GGCTGACCGC GGCCGACGTC 
ACGAGCAGGG TGGCGCGGGC GCTGCCCAAG GCGCGGATCA TCCCGCTGTC GGCCGACGAC 
GACGTGGTCG GGGTCATGGA CCAGGCCGCG CGCACCAGCG AGGTGCTGGC GGTGGCGGGC 
GGCGACGGCA CCGTCAACGC CGGGGCGCAG GCGGCGCTCG ACCACGACCG CCCGCTGCTG 
GTGCTGCCGG ACGGCACCCT CAACAACTTC GCCCGCACCC TGGGGCTGTC CTCGGTGGAC 
ATCGCGCTGC GGGCCTTCGA CGACGGGCGG CTGGCCCGGG TGGACGTGGG CGAGGTGGAC 
GGCCGGATCT TCCTCAACAC GTCCTCCTTC GGCTCCTACC CGCGCATGGT GGACCGGCGC 
GACAAGTGGG CCGAGCGGAT CGGCAAGTGG CCCGCGTTCG CGCTGGCCCT GTGGCAGGAC 
CTGCGGGAGG TGAGCCCGAT CTCCGCGGTC GTGGACGGCG AGCCCGCCAA GGTGTGGTGG 
GCGTTCGTGG GCAACTGCCA GTACCGCACG CACGGCCGGG TGCCCGCGCT GCGCGAGCAG 
CTGGACGACG GGCGGCTGGA CGTGCGGGTG CTCACCGCGC GGGCGCCCTT CCCGAGGCTG 
CGCGCCGTCG CGGACGTGCT GCTGGGCAAG TTCGCGCACG GCGAGGGGTA CTCCGAGCGG 
CTGACCACGG GGCTGACGCT GACCATCCCG GGCGAGCCCA GGCTGCTCGC CGTGGACGGC 
GAGGTCGTGG AGGGCTCGCG CACGGTGGTC TTCACCAAGC GGCACGCGGC CCTGCGGGTG 
TTCGTGCCCG CCGTCGAGAC CGACCGGTGA

Protein sequence

MSRLQRADKK VYDHVTGLGP ASLDAYTPKF VQATDNMAPW FLMSATLAAT GGPRLRRTAL 
RAILAAGTAN LVSAGIKQIS GRTRPDNSAV PAARSPYRSY PSTSFPSGHT AAAAAYAAGV 
MTDAPKPLAG LVALLAGGVA FSRVHSGVHY PGDVLAGVAI GCGAALLAGT VVPPRPELVF 
GARTVADGET DVDREGGGVT VVVNPRSASG TVPGLTAADV TSRVARALPK ARIIPLSADD 
DVVGVMDQAA RTSEVLAVAG GDGTVNAGAQ AALDHDRPLL VLPDGTLNNF ARTLGLSSVD 
IALRAFDDGR LARVDVGEVD GRIFLNTSSF GSYPRMVDRR DKWAERIGKW PAFALALWQD 
LREVSPISAV VDGEPAKVWW AFVGNCQYRT HGRVPALREQ LDDGRLDVRV LTARAPFPRL 
RAVADVLLGK FAHGEGYSER LTTGLTLTIP GEPRLLAVDG EVVEGSRTVV FTKRHAALRV 
FVPAVETDR