Gene Ndas_0956 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0956
Symbol
ID	9244801
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	1171322
End bp	1172443
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	76%
IMG OID
Product	glycerate kinase
Protein accession	YP_003678906
Protein GI	297559932
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.421654
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCCTGGC ACACTGGTCC GGTGCGTATC CTCATCGCTC CTGACAAGTT CGCCGGTACC 
CTCTCCGCCC TCGAAGCCGC GCAGGCGGTC GCCGACGGCT GGCACCGGAC CGATCCCTCC 
GCCACGACGG ACCTGCTGCC GCTCTCCGAC GGCGGCCCCG GTTTCGTCGA GGTCCTGCAC 
ACGGCCCTCG GCGGCGAGGT GCACCGGACC GAGGTGACCG GCCCCCTCGG CGCGCCCGTG 
ACCGCGGAGT ACCTCCTGGA CGGCGACACC GCCTACGTGG AGAGCGCCCA GGCCTGCGGC 
CTGCACCTGG TGCCCTCCGG TGACCGCGAC CCCGGCCGAA CCACCACCCG CGGCGTCGGC 
GAGCTGGTCG CCCACGCGGT CCGCTCCGGC GCCCGCACCG TCGTCGTCGG ACTCGGCGGC 
AGCTCCACCA ACGACGCCGG AGCCGGTCTC CTGGCCGCCC TGGGCGCCAC CCCCGCCGAC 
CGCCTGAGCC ACGGCGGCGG CCCCCTGGCC GACCCCGGGG ACGTCGACCT CGACGCGGCC 
CGCCGGGCCG TGGCCGGGGT CCGTATCGTC GCCGCCACCG ACGTCGACAA CCCCCTGCTG 
GGCATCCACG GGGCCAGCGC CGTCTTCGGG CCCCAGAAGG GCGCCGACCC CGACCAGGTG 
CAGCGCCTGG ACGCCGCCCT CAACGCCTTC GCCGACCGCG TCGACCCCGG GGGCGAGGTC 
CGCGACACCC CCGGTGCCGG AGCCGCGGGC GGCCTGGGCT TCGCCCTGCT CCTGCTCGGC 
GGCACCGTCG AGTCGGGCAT CAGCCGCGTC CTGGACTCCG TGCGCCTGGC CGAGCGCCTC 
TCGGAGGCCG ACCTGGTCAT CACCGGCGAG GGCTCCTTCG ACTCCCAGTC CCTGCGCGGC 
AAGCTGCCCC ACGGCGTCGC CCAGGCCGCC AACAAGCACG GCGTCCCCTG CGTGGTGACC 
GCGGGCGCGG TCAAGGTCGG CCGCGCCGAG GCGGCCGCCG CCGGGATCAC CGAGACCTAC 
TCCCTCGTGG AGTCCTCGGG CTCGGTCGAG GCCGCCATGA CCCGCTCCGC GGACGAACTG 
CGCGCCCTGG CCGCCGACAT CGCCCGCCGC TGGACCCGCT GA

Protein sequence

MAWHTGPVRI LIAPDKFAGT LSALEAAQAV ADGWHRTDPS ATTDLLPLSD GGPGFVEVLH 
TALGGEVHRT EVTGPLGAPV TAEYLLDGDT AYVESAQACG LHLVPSGDRD PGRTTTRGVG 
ELVAHAVRSG ARTVVVGLGG SSTNDAGAGL LAALGATPAD RLSHGGGPLA DPGDVDLDAA 
RRAVAGVRIV AATDVDNPLL GIHGASAVFG PQKGADPDQV QRLDAALNAF ADRVDPGGEV 
RDTPGAGAAG GLGFALLLLG GTVESGISRV LDSVRLAERL SEADLVITGE GSFDSQSLRG 
KLPHGVAQAA NKHGVPCVVT AGAVKVGRAE AAAAGITETY SLVESSGSVE AAMTRSADEL 
RALAADIARR WTR