Gene Ndas_5250 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5250
Symbol
ID	9249147
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	-
Start bp	411796
End bp	413145
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	71%
IMG OID
Product	protein serine/threonine phosphatase
Protein accession	YP_003683136
Protein GI	297564163
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.383211
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAATCG CTCTCCGATA CGCGGCGTAC TCCGACGTAG GATGCCTCCG CGAAGGCAAC 
GAAGACTCCG GCTACGCCGG CCAGAACCTC CTCGCGGTCG CCGACGGCAT GGGCGGTTAC 
GCCGGCGGCG AGGTGGCCAG CTCCATCGCG ATCTCCTCGA TCCGCCGCCT CGACTCCGAG 
CCGCCCCGGT CCGACGAGAT GGCCGAGGTG CTCCAGCGCG CCGTCGAGCA GGCCAACGCC 
TCCCTGTCGC GCAGGATCAT GGAGGAGCCC CAGCTGGAGA ACATGGGCAC CACCCTGACG 
GCCATGCTCT GGGCCGGTCC GCGGGTGGCG CTCATCCACA TCGGCGACTC CCGCGCCTAC 
CTCATGCGCG GCCCCCGCTT CGAGCAGATC ACCCACGACC ACACCCTGGT GCAGACCCTG 
GTGGACGAGG GCAAGATCAC CGAGGAGGAG GTCGCCACCC ACCCGCAGCG CTCCCTCATC 
CTGCGCGCCC TGGACGGCAA GAGCCCGGTC GACCCCGACA TCTCCATCAG CGAGGCCAAG 
GCGGGCGACC GCTACCTGCT CTGCTCCGAC GGGCTCTCCG GCGTGGTCAG CAAGAAGACC 
ATCCACGAGA CCCTCGCCAC CGAGGCCGAC CCGCGCAGCG CGGCCAAGAA GCTCATCGAG 
CTGGCCATCC GCGGCGGCGG CCCGGACAAC ATCACCGCGG TCGTCGCCGA CGTCATCGAG 
GCCGAGACCG ACAGCGAGGG GCCCACCCGC GCCTCCCAGG TGGTCGGCGC CGCGGACCAG 
CGCCGCGAGA ACGTCGACCA GGGCAACGAC ACACCCGCCA GACGGGCGCA GGAACTGCGC 
GGGGGATCCG GCGACACCGC CGAGATGGAC CCCGTCCGTG ACGAGCCCGG CCCGGACGCC 
TACGCCTCGG GCGGCGCCTA CCAGGAGTCC TACAACGGCG ACTACGACGA CTACGAGGCC 
CCGCCGGCCG ACCGGCGGGG CCGTCCCGAA CCCGAGTACC GCCGCAGGCG CTGGTGGCCG 
ATGGTGCTGG TGTTCCTGGT CGTGGTCGCC GTCGTCGCGG GGGCCACGTA CTACTTCGGC 
AGCCGCTACG TGAACAGCCA GTACTACGTG GGCCCCTCCC CCTCGGGGGA CACCGTCAGC 
ATCTACCAGG GCATCAACAC CGACATCGCG GGCTTCAGCC TGTCGGAGGA GGTGGAGGAG 
ACCGGGATCA CCCTGGACTC GCTCTCGGAG GCCGACCGCG GATCGGTGGA GAACACCCTG 
CCCGCGGAGA GCCTGGACGA CGCCCGGGCG AGCGTGGACG TGCTGAGCGA GGGTACGGCC 
GGGGCCCGGA CCGAGGAAGG GTCCGGGTGA

Protein sequence

MTIALRYAAY SDVGCLREGN EDSGYAGQNL LAVADGMGGY AGGEVASSIA ISSIRRLDSE 
PPRSDEMAEV LQRAVEQANA SLSRRIMEEP QLENMGTTLT AMLWAGPRVA LIHIGDSRAY 
LMRGPRFEQI THDHTLVQTL VDEGKITEEE VATHPQRSLI LRALDGKSPV DPDISISEAK 
AGDRYLLCSD GLSGVVSKKT IHETLATEAD PRSAAKKLIE LAIRGGGPDN ITAVVADVIE 
AETDSEGPTR ASQVVGAADQ RRENVDQGND TPARRAQELR GGSGDTAEMD PVRDEPGPDA 
YASGGAYQES YNGDYDDYEA PPADRRGRPE PEYRRRRWWP MVLVFLVVVA VVAGATYYFG 
SRYVNSQYYV GPSPSGDTVS IYQGINTDIA GFSLSEEVEE TGITLDSLSE ADRGSVENTL 
PAESLDDARA SVDVLSEGTA GARTEEGSG