Gene Ndas_4902 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4902
Symbol
ID	9248789
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	-
Start bp	31755
End bp	32894
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	77%
IMG OID
Product	galactokinase
Protein accession	YP_003682791
Protein GI	297563818
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.227753
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACGACG TGACGACCGC GTTCCACTCG GCGTTCGGGT ACGGGCCCGA GGGCGTGTGG 
ACCGCGCCGG GGCGGATCAA CCTCATCGGC GAGCACACCG ACTACAACGA CGGGTTCGTG 
CTCCCCTTCG CCCTGCCCCA CGCGCTGACG GCCTCGGCCG CCCGGCGGAC GGACGGGCGG 
GTGCGGCTGC TCTCCCGGCA GTCGCCGGAG GAGTACGCGG GCCCGGTGGG CGACCTGGTC 
CCCGGCGCGG TGGAGGGGTG GGCCGCCTAC CCCGCCGGGG CGCTGTGGGT CCTGCGGGAC 
GAGGGCCACC CGGTGGACGG GCTGGACCTG CTGGTGGACA GCACGATCCC GAGCGGGGCG 
GGCCTGTCCT CGTCGGCCGC GCTGTCGTGC GCGGCCGTCA TGGCCGCGGC CTCCCTGTAC 
GGGGCCGACC TCGCGCCGGG CGGGGTGGCC CGGCTGGCCC AGCGGGTGGA GAACGACTTC 
GTGGGCATGC CCTGCGGGAT CCTGGACCAG TCCGCGTCCA TGCTCTCCAC CGAGGGGCAC 
GCCCTGTTCA TGGACACGCG CACCCTGGAG ACCGAGCAGG TGCCCTTCGA CCCCTCCGCG 
GACGGGCTGA CCGTGCTGGT GGTGGACACC CGCGCCCCGC ACCGGCACGT GGACGGCGCC 
TACGCCGAGC GGCGCCGCTC GTGCGAGGAG GCCGCGCGCG TCCTGGGGGT GGCGGCCCTG 
CGCGACGTCA CCGACCTGCC GGGCGCCCTG GCCGCGCTGC CCGACGACGT GTCCCGCCGC 
CGGGTGCGCC ACGTGGTGAC CGAGAACGGG CGGGTGCTGC GGGCCGTGGA CCTGCTCCGG 
TCCGGGCGCA CACGGGAGGT GGGGCCGCTG CTCACCGCCT CCCACGCCTC GCTGCGCGAC 
GACTACGAGG TGAGCGTGCC CGAGGTGGAC ACCGCGGTGG ACGCGCTGCT GGCCGCGGGC 
GCGCTGGGGG CCAGGATCAC CGGCGGCGGC TTCGGCGGGT GCGTGGTCGC CCTGGTGGAG 
ACCGGGCGCG TGGAGGCCTG CGGGAAGGCG GTGCTGGAGG CCTACCGGGA GCGGGGCTTC 
GAGGAACCGG CCGCGTTCGG TGCCCTGCCG TCCGCGGGGG CGCGCCGTCT GCACCCCTGA

Protein sequence

MDDVTTAFHS AFGYGPEGVW TAPGRINLIG EHTDYNDGFV LPFALPHALT ASAARRTDGR 
VRLLSRQSPE EYAGPVGDLV PGAVEGWAAY PAGALWVLRD EGHPVDGLDL LVDSTIPSGA 
GLSSSAALSC AAVMAAASLY GADLAPGGVA RLAQRVENDF VGMPCGILDQ SASMLSTEGH 
ALFMDTRTLE TEQVPFDPSA DGLTVLVVDT RAPHRHVDGA YAERRRSCEE AARVLGVAAL 
RDVTDLPGAL AALPDDVSRR RVRHVVTENG RVLRAVDLLR SGRTREVGPL LTASHASLRD 
DYEVSVPEVD TAVDALLAAG ALGARITGGG FGGCVVALVE TGRVEACGKA VLEAYRERGF 
EEPAAFGALP SAGARRLHP