Gene Ndas_5336 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5336
Symbol
ID	9249239
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	-
Start bp	510690
End bp	511949
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	70%
IMG OID
Product	phosphoserine phosphatase SerB
Protein accession	YP_003683222
Protein GI	297564249
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.414905
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.119609
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGAGA AATCCACGCT GTTGGTGACG GTGACCGGCC ACGACCGTCC GGGCATCAGT 
GCTCGTCTGC TGAGCACCCT CTCCGTCTTT CCGGTGACCA TCGCCGACCT GGAACAGGTG 
GTCCTCGCGG GCCGCCTCGT GCTGGGCGCG GTCCTGGAGG TGGACGAGCG GGTGGCTCCC 
GGTGTGAGTC CCTCGCGGGT CTTCGAGGAG GTCCGCAACG CGCTCGACAA GACCGCCATC 
GACCTCGACA TGGAGGTCGG CTACGGCAAG AGCGGAGGGA AGGACAACGG CCGCGTGAAG 
GCGGTCGTCC ACGACCGGCT GCACGTGACC GTCCTGGCCG ACCCGCTGCG TCCCGGCGCC 
CTGGGCGCCC TCACCTCGTG CGTCGCGCGC GCGGGCGCGA ACATCGACCG GATCGAGCGG 
CTGTCCAGCT TCCCGGTGAC CTCCGTGGAG ATGGAGATCT CCGGCGGTGA CGCCGACCAG 
CTGCGCGCCG AACTCGCCAT GGAGGGGTCC ACCCAGGGGG TGGACGTGGC CGTGCAGCCC 
AGCGGCCTGC ACCGGCGGGC CAAGCACCTC ATCGTCATGG ACGTGGACTC CACGCTGATC 
CAGGGCGAGG TCATCGAGCT GCTGGCCGCG CACGCCGGAT GCGCGGACGA GGTCGCCCGG 
GTCACCGAGG AGGCCATGCG CGGCGAGCTG GACTTCGAGG AGTCGCTGCG CCGCCGGGTG 
ATGCTGCTGA GGGGCCTGGA CGCCTCCGCC ATTCCCAAGG TGTGCGAGGA GATCCAGCTG 
ACACCGGGCG CCAGGACGCT GGTCCGCACC CTGAAGCGCC TGGGGTACGA GTGCGGGATC 
GTCAGCGGCG GCTTCACCCA GTTCACGGAC GTGCTCGTGG AGCGCCTCGG GTTGGACTAC 
GCCGCCGCGA ACACCCTGGA GATCGTCGAC GGCAAGCTCA CCGGCGAACT GGTGGGGCCG 
ATCATCGACC GCAAGGGCAA GGCGACCACC CTGGAGCGGT TCGCCGCGGA GGCCGGTGTG 
CCCCTGGAGC AGACCGTGGC CGTGGGCGAC GGCGCGAACG ACCTGGACAT GCTGCAGGCG 
GCGGGGCTGG GCGTGGCGTT CAACGCCAAG CCGGTCGTGC GGCAGCAGGC CGACACCTCG 
GTGAGCGTGC CCTACCTGGA CACGATCGCG TTCATCCTCG GAATCACCCG GGAGGAGATC 
GAGGCCGCGG ACATGCGGGA CCAGATCAAT CCGGTGTCGG ATTCGGTGCC GCACGACTGA

Protein sequence

MNEKSTLLVT VTGHDRPGIS ARLLSTLSVF PVTIADLEQV VLAGRLVLGA VLEVDERVAP 
GVSPSRVFEE VRNALDKTAI DLDMEVGYGK SGGKDNGRVK AVVHDRLHVT VLADPLRPGA 
LGALTSCVAR AGANIDRIER LSSFPVTSVE MEISGGDADQ LRAELAMEGS TQGVDVAVQP 
SGLHRRAKHL IVMDVDSTLI QGEVIELLAA HAGCADEVAR VTEEAMRGEL DFEESLRRRV 
MLLRGLDASA IPKVCEEIQL TPGARTLVRT LKRLGYECGI VSGGFTQFTD VLVERLGLDY 
AAANTLEIVD GKLTGELVGP IIDRKGKATT LERFAAEAGV PLEQTVAVGD GANDLDMLQA 
AGLGVAFNAK PVVRQQADTS VSVPYLDTIA FILGITREEI EAADMRDQIN PVSDSVPHD