Gene Arth_0139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0139
Symbol
ID	4447402
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	141220
End bp	142314
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	66%
IMG OID	639687934
Product	diacylglycerol kinase, catalytic region
Protein accession	YP_829640
Protein GI	116668707
COG category	[I] Lipid transport and metabolism [R] General function prediction only
COG ID	[COG1597] Sphingosine kinase and enzymes related to eukaryotic diacylglycerol kinase
TIGRFAM ID	[TIGR00147] lipid kinase, YegS/Rv2252/BmrU family

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGATT GGCTGCTCTA CCTCATCCTT GCTGCGGCCC TGGCTTTCGC GGTCTCCAGC 
TGGTGGGGCG TGCGGCGGCT GAAGGCGCTG CATACGCGCA GCGCCGTCCA GGAGGACACG 
CACCATCCGG GCATGGCGCA GCAGAAGGTG GCCGTGGTCA TGAACCCGGT CAAGGCGAAA 
TCGTCGGAAG CCCGTGCACT CATCCAGCGC GCCTGCCTGT CCGCCGGCTG GGAAGCCCCC 
CTCTTCTTCG ATACAACTGC CGAGGACCCC GGGTACGCGC AAGCCGAGGC GGCAGTCGCA 
AGCGGGGCCG ACGTCGTCCT GGTGGGCGGC GGGGACGGCA CCGTGCGTGT AGTGGCTGAG 
AAGCTCGCCC GCACGAACGT GCCCATGGGC CTGGTTCCGC TGGGCACGGG AAACCTGCTG 
GCCAGGAACA TCCACCTGGA CGTCAACGAC CTCCACGGCA GCATCCAGAC AGCGCTCTTT 
GGGCACCAGC GGCACATCGA CACGGCCCGC ATGGGTATCA GGAACTCCCG GACGGGTGCC 
TCGTCAGAGC ACGCATTCCT GGTGATTGCC GGCATGGGCA TGGATGCCGA AGTCGTCGGA 
GACACCAACG ACGGGCTGAA AAAGGCGGTG GGCTGGCTCG CCTACACGGA GGCAGGAGTC 
CGGCATCTGC CGGGGCGGCG CAAGAAGGTG TCCATCGCCC TGGACGACCA GCCGGAACAG 
TCCCGGAAGA TCCGCAGTGT GCTGTTCGCC AACTGCGGCC TCATTCCGGG CGGCATCGAC 
TTCATTCCGC AGGCAATGAT CGACGACGGA ATGCTGGACG TGGTGGTGAT GAGCCCCCGC 
AGCGCCATCG GGTGGATCGC GATGTACACA AAGGTCATGT TCAAGCACAA AGGGAACCTG 
CCGGTGATGA GCTATTACCG TTCCGGCAAG ATCGTCATCA AGTGCGCCGA GCCGGTGGCC 
ACCCAGGTCG ACGGCGATCC GTGCGGCGAG GCGACCGACG TTACGGTTCA GGTGGAGCCG 
CGGTCCCTGC TGGTCCGGGT TCCGGAACGC AAGGGCGGCG AAACGCCCGC AAGGGAAGCG 
TCGGCCCCGC ATTAG

Protein sequence

MNDWLLYLIL AAALAFAVSS WWGVRRLKAL HTRSAVQEDT HHPGMAQQKV AVVMNPVKAK 
SSEARALIQR ACLSAGWEAP LFFDTTAEDP GYAQAEAAVA SGADVVLVGG GDGTVRVVAE 
KLARTNVPMG LVPLGTGNLL ARNIHLDVND LHGSIQTALF GHQRHIDTAR MGIRNSRTGA 
SSEHAFLVIA GMGMDAEVVG DTNDGLKKAV GWLAYTEAGV RHLPGRRKKV SIALDDQPEQ 
SRKIRSVLFA NCGLIPGGID FIPQAMIDDG MLDVVVMSPR SAIGWIAMYT KVMFKHKGNL 
PVMSYYRSGK IVIKCAEPVA TQVDGDPCGE ATDVTVQVEP RSLLVRVPER KGGETPAREA 
SAPH