Gene Ndas_4404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4404
Symbol
ID	9248279
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	5238439
End bp	5239851
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	77%
IMG OID
Product	protein serine/threonine phosphatase
Protein accession	YP_003682299
Protein GI	297563325
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.275687
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAAGG TGCGGACCTG CCCCGCCTGC TCGGACAGGG TGTCCACGGA GGACGCCTTC 
TGCGAGGGGT GCGGACGCCC CCTCCCCGAG GGCGCGGAGA ACGCGGGGCA CCCCGACAGC 
ATGCCCACCG CCCCGCAGGC GAGCCTGGCC GGTGCGGTAC CGCCCGGCGG GTGGTCCCGG 
GACGGGGCCG ACGGCGGCGC GCGGAACGGG GGAGCCCCGG GTCCGTCCGG TGCCGTGTCG 
CCCGGCGCCG ACGCGCGTCC CGGCCTGGTG CCCGACGACG GCGCACCCAC GGCTCCGCAG 
GTGAGCCTGC GGTCCCTCGA CACGGGCGGG CGGGACGCGC CCGCGCCGCA GGCGCTGCCC 
GACTCCGCCC CGCACGCGGC CGACTCCATG GTCACCCAGC CGATACGCCG GGACAGCCTG 
CCCTCGTTCG CGTCCTCCGC GCCCCCGGCC GCCCAGCCGG AGGCCGTCCC CGACTGGCCG 
CCGCCCGCCA CCGGGAGCAA CCCGGTGCGG CCCGCCAACC CCGGCCTGTG CGCGTGGTGC 
CCCGGAGCGG TCAGCGACGG CTACTGCGAG CGGTGCGGCC TCCTCCAGCC CACCGGGCGC 
GACCACGTCG AGGTGCGCAC GCGCGCCGCC GTCGGCGTCA GCGACCGCGG GCTGCGGCAC 
AGGCGCAACG AGGACGCCAT GGCGATCCGT GTGATCGACG CCGACCACCC CCGCGCACCC 
GGCGTGGTCT GCGCCGTGGT CTGCGACGGG GTGTCCAGCT CGCCGCGCTC GGACGAGGCC 
TCCCGCGTCA CCGCCGAGAC CGGAGTGGCC GTCCTCGCCG AGCGCGTCAG CCAGGGCGCC 
GACCCCCGCG AGGCCACCGG CGCGGCGATG ATCCGGGCCG CCGAGGCGGT CGCCGGGATC 
GCCGACTCGC CCCGCTCCGC GCCCGCGTGC ACCTTCGTGT CGGCGGTCTA CGACCCCGCC 
GCGGGCACCG TCACCGTCGG CTGGGTCGGC GACAGCCGCG CCTACTGGCT CTCCGGAGGC 
CCCACTTCCA GCGCTTCGGC CCTGCTGACC AGGGACGACT CCTGGAGCGA GGCGATGGTG 
CAGATGGGGG CGCTCTCCCG CGAGGAGGCG ATGCGCTCCT CCAACGCCCA CGCCCTCGTC 
GCGTGGATGG GCGCCGACTC CGGCGAGATC GACGCCCACA TCTCCACCGT GACCCCGACC 
GGCCCCGGCG CGGTCGTGCT GTGCAGCGAC GGCCTGTGGA ACTACTTCCC CGAGGCGCAG 
GCGCTCACCG ACGCCGTCCC GGGGGCGGGG GCCAGACCCC ACGAGGCCGC GCGCGCCTAC 
GTCGACCTCG CCCTGGAGGC GGGCGGCAAG GACAACATCA CCGTCGTGAT CGTTCCCGTG 
CCCGCTGGGG GTCCCCGTGC CCGACACGAC TGA

Protein sequence

MTKVRTCPAC SDRVSTEDAF CEGCGRPLPE GAENAGHPDS MPTAPQASLA GAVPPGGWSR 
DGADGGARNG GAPGPSGAVS PGADARPGLV PDDGAPTAPQ VSLRSLDTGG RDAPAPQALP 
DSAPHAADSM VTQPIRRDSL PSFASSAPPA AQPEAVPDWP PPATGSNPVR PANPGLCAWC 
PGAVSDGYCE RCGLLQPTGR DHVEVRTRAA VGVSDRGLRH RRNEDAMAIR VIDADHPRAP 
GVVCAVVCDG VSSSPRSDEA SRVTAETGVA VLAERVSQGA DPREATGAAM IRAAEAVAGI 
ADSPRSAPAC TFVSAVYDPA AGTVTVGWVG DSRAYWLSGG PTSSASALLT RDDSWSEAMV 
QMGALSREEA MRSSNAHALV AWMGADSGEI DAHISTVTPT GPGAVVLCSD GLWNYFPEAQ 
ALTDAVPGAG ARPHEAARAY VDLALEAGGK DNITVVIVPV PAGGPRARHD