Gene Ndas_3009 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3009
Symbol
ID	9246862
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	3592137
End bp	3593321
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	74%
IMG OID
Product	Phosphoglycerate kinase
Protein accession	YP_003680925
Protein GI	297561951
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0329661
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGACGA TCGACGACCT CGACGTCTCC GGCAGGCGCG TGTTCGTCCG GGCCGACCTG 
AACGTGCCCC TGGACGGCGA CCGCATCACC GACGACGGGC GCATCCGCGC GGCCGTGCCC 
ACCATCTCCG CGCTGCGCGA GCGCGGCGCC CGCGTCATCG TCGCCGCCCA CCTGGGCCGC 
CCCAAGGGAG CCCCGGACCC CCGCTACTCT CTGCGCCCGG TCGCCGCCCG CCTGGGCGAA 
CTGCTCGGCG CCGAGGTGGC CTTCGCCTCC GACACCGCCG GGGAGTCGGC CCGCGCCACC 
TCCGAGGCCC TCACGGACGG TCAGGTCGCC CTGCTGGAGA ACGTGCGCTT CGAGCCGGGG 
GAGACCAGCA AGGACGACGC CGAGCGCGGG GAGCTCGCCG ACCGCTTCGC CCAGCTCGCC 
GACCTGTACG TGGGCGACGC CTTCGGCGCC GTGCACCGCA AGCACGCCAG CGTCTACGAC 
CTGCCCGGCA GGCTGCCGCA CGCCGTCGGC GGCCTGGTGC TGAACGAGGT CGAGGTGCTG 
CGCAGGCTCA CCGGCGCCCC CCAGCGGCCC TACGCCGTGG TCCTGGGCGG CTCCAAGGTC 
TCCGACAAGC TCGGCGTCAT CGACAACCTG CTGGGCACCG CGGACCGCCT GCTCATCGGC 
GGCGGCATGG TCTTCACCTT CCTCAAGGCC CAGGGCCACG AGGTCGGCTC CAGCCTGCTG 
GAGGCCGACC AGCTCGACAC CGTCAAGGGC TACCTGGAGC GCGCCGAGCG CGAGGGCGTG 
GAGATCGTCC TGCCGGTGGA CGTGGTGGCC GCCGAGAAGT TCTCCGCCGA CGCCGCGCAC 
GACGCGGTCG CCGTCGATGC CATCCCGTCC GACCGGATGG GCCTGGACAT CGGCCCCCGC 
AGCCAGGAGC TCTTCGCGCG GAAGCTGGCC GACGCCCGCA CCGTGTTCTG GAACGGCCCG 
ATGGGCGTCT TCGAGATGGA GCCCTACGCC GGGGGCACCC GCGCGCTGGC CCAGGCCCTG 
ATCGACTCCG GCGCCTTCAC CGTGGTCGGC GGCGGCGACT CCGCCGCGGC CGTGCGCGCG 
CTGGGCTTCG ACGAGGCGGC CTTCGGCCAC ATCTCCACCG GCGGCGGCGC CAGCCTGGAG 
TACCTGGAGG GCAAGGACCT GCCCGGTATC GACGCCCTGA AGTAA

Protein sequence

MRTIDDLDVS GRRVFVRADL NVPLDGDRIT DDGRIRAAVP TISALRERGA RVIVAAHLGR 
PKGAPDPRYS LRPVAARLGE LLGAEVAFAS DTAGESARAT SEALTDGQVA LLENVRFEPG 
ETSKDDAERG ELADRFAQLA DLYVGDAFGA VHRKHASVYD LPGRLPHAVG GLVLNEVEVL 
RRLTGAPQRP YAVVLGGSKV SDKLGVIDNL LGTADRLLIG GGMVFTFLKA QGHEVGSSLL 
EADQLDTVKG YLERAEREGV EIVLPVDVVA AEKFSADAAH DAVAVDAIPS DRMGLDIGPR 
SQELFARKLA DARTVFWNGP MGVFEMEPYA GGTRALAQAL IDSGAFTVVG GGDSAAAVRA 
LGFDEAAFGH ISTGGGASLE YLEGKDLPGI DALK