Gene Phep_4164 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_4164
Symbol
ID	8255299
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	+
Start bp	5037970
End bp	5038848
Gene Length	879 bp
Protein Length	292 aa
Translation table	11
GC content	42%
IMG OID	644937829
Product	diacylglycerol kinase catalytic region
Protein accession	YP_003094417
Protein GI	255534045
COG category	[I] Lipid transport and metabolism [R] General function prediction only
COG ID	[COG1597] Sphingosine kinase and enzymes related to eukaryotic diacylglycerol kinase
TIGRFAM ID	[TIGR00147] lipid kinase, YegS/Rv2252/BmrU family

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00574485
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.00000041756
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCATAAAA AGACTTCCAA ATTAAAATTG CTGTTTATTG TGAACCCTGG CTCGGGAAGT 
GGAGAGATAA ACTTCAGCGA GGTCATTGGC AATTATTTTG CCGAAAAAAC ACAGGATTTT 
GAGATTTACA AACTTACAAA AAACTGTTCT CTAACTAAGA TCAAGGGTGT TATTCAGCAA 
TCGATGGCCG ATAGGGTAAT TGCCGTAGGT GGGGATGGCA CCTTAAAACT GGTTGCAGAG 
TGCGTACTGG AAACCAACAT ACCAATAGGC ATTATTCCGG CTGGTTCTGC CAATGGCATG 
GCCCGCGAAC TAAACATCCC CTCCAGAATA GAAGAAGCGC TTGATATCGC CATAAATGCC 
CCGGCTAAAA AGATACATGC CGTTATTGTA AACGGCGAGC TCTGTATCCA TCTGGCCGAC 
ATTGGCTTTA ATGCTTACCT GGTAAAGAAA TTTGATGCCC TGCCGCAACG CGGAATGCTT 
GCCTATGCTA AAGCAGCCTG GACAGCCCTC TGGAATCATT ATAAAATGGA AGTTGAATTT 
AAGATCAAAG ATAAAACCAT TCACTCAAAG GCTGCCATGG TGGTTATAGC CAATGCCACT 
ATGTATGGTA CGGGAGTTAA GATCAATCCT GATGGGCAAC TGGATGATGA CTTTTTTGAG 
GTCATCCTTG TTAAAGAATA CTCCTTCATG GAAATACTTA AACTAAAGTT TACCAACCTG 
CCTTTTAATC CAAAAAACAT CGAGTCCTTC CAAACTACCA ATCTCAGTAT TAAAACCCGG 
CATAAGGCCC ATTTCCAGGT CGACGGAGAA TATATAGGAA AACTGAACAA CATTAAAGCG 
CACATCGTTA AAGATGCCAT CCACATCATT GCACCATAA

Protein sequence

MHKKTSKLKL LFIVNPGSGS GEINFSEVIG NYFAEKTQDF EIYKLTKNCS LTKIKGVIQQ 
SMADRVIAVG GDGTLKLVAE CVLETNIPIG IIPAGSANGM ARELNIPSRI EEALDIAINA 
PAKKIHAVIV NGELCIHLAD IGFNAYLVKK FDALPQRGML AYAKAAWTAL WNHYKMEVEF 
KIKDKTIHSK AAMVVIANAT MYGTGVKINP DGQLDDDFFE VILVKEYSFM EILKLKFTNL 
PFNPKNIESF QTTNLSIKTR HKAHFQVDGE YIGKLNNIKA HIVKDAIHII AP