Gene Noca_4345 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4345
Symbol
ID	4596863
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	4593998
End bp	4594894
Gene Length	897 bp
Protein Length	298 aa
Translation table	11
GC content	74%
IMG OID	639778955
Product	diacylglycerol kinase, catalytic region
Protein accession	YP_925529
Protein GI	119718564
COG category	[I] Lipid transport and metabolism [R] General function prediction only
COG ID	[COG1597] Sphingosine kinase and enzymes related to eukaryotic diacylglycerol kinase
TIGRFAM ID	[TIGR00147] lipid kinase, YegS/Rv2252/BmrU family

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATCACCA ACAGTGAGGC CGGCACCTCC GACGAGGAGT CGCTGGCGGC CGCGCTCGCC 
GTGCTCCGCG AGCGGGCCTC GGTCGAGGTG GCGGCCACGG CCAACCCCGG TGAGCTCGAC 
GGCGTGCTGC ACCGCGCGGG CTCGCGCCGG ATCGTGGTCG CGGGCGGCGA CGGCAGCCTG 
CACGCGGTGA TCTCCGCGCT GCACCGCCGC CAGGAGCTGG GGGGCGCCAC CCTCGGGCTG 
CTCCCGCTCG GCACCGGCAA CGACTTCGCG CGCGGCACCG GGATCCCGCT CGACATCGAG 
GACGCCGCCC GGGTCGTGCT GCGCGACCGG CCGCGGCCGA TGGACCTCGT CGTCGACGAG 
GTCGGCGAGA TCGTCGTCAA CAGCGTGCAC GTCGGGGCGG GCGCCGAGGC CAGCCGCAAG 
GGTGCGTCCT GGAAGAACCG GCTCGGGTCG ATCGGCATCG GCAGGCTCAA CCTGGGCAGG 
CTCGGCTACC CGATCGGGGC GGCCCTGACC GCGATCGACC CGCCCAGTGT GCGGGTCCGG 
GTCGAGGTCG ACGGCGAGCC CATCTGCGAC CTGAACGACC CGGTGCTGAT GGTGGCGATC 
GGCAACGGCC CGTCCGTCGG CGGAGGCACC CACCTGACCC CCGAGGCCAG CCCGCTCGAC 
GGGAAGGTCG ACGTGATGAT CTCGCGCGCC GTCGGGCCCG TGTCCCGACT GCTGTACGGC 
GCGCGGCTGG GCCTGGGCAC CCACCACCGG CAGGACGACA GCACCTACCT GCGCGGCAGC 
ACCGTCTCGG TCTCCGGCGG GCCGTTCTGG TGCAGCGCCG ACGGCGAGGT CTACGGTCCC 
GAGCGGCAGC GCACCTGGCG GGTCGAGCCG GGCGCGTACT CGATGCTGCT GCCCTGA

Protein sequence

MITNSEAGTS DEESLAAALA VLRERASVEV AATANPGELD GVLHRAGSRR IVVAGGDGSL 
HAVISALHRR QELGGATLGL LPLGTGNDFA RGTGIPLDIE DAARVVLRDR PRPMDLVVDE 
VGEIVVNSVH VGAGAEASRK GASWKNRLGS IGIGRLNLGR LGYPIGAALT AIDPPSVRVR 
VEVDGEPICD LNDPVLMVAI GNGPSVGGGT HLTPEASPLD GKVDVMISRA VGPVSRLLYG 
ARLGLGTHHR QDDSTYLRGS TVSVSGGPFW CSADGEVYGP ERQRTWRVEP GAYSMLLP