Gene Franean1_0894 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0894
Symbol
ID	5669308
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1043618
End bp	1044568
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	74%
IMG OID	641239821
Product	diacylglycerol kinase catalytic region
Protein accession	YP_001505256
Protein GI	158312748
COG category	[I] Lipid transport and metabolism [R] General function prediction only
COG ID	[COG1597] Sphingosine kinase and enzymes related to eukaryotic diacylglycerol kinase
TIGRFAM ID	[TIGR00147] lipid kinase, YegS/Rv2252/BmrU family

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.495381
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.488234
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAGC CGGGCACGGC CAGCAGCAGC ACCGCGGCGC GGGCCGAGGT GCCCGACGCG 
GCGGTGGACC GTTCGAGGCT CACCGTCGTG GTCAACCCGA AGGCTGGCGG CGGCCGGGCG 
GCGAAGGTCC TCGACGGCGT CCGCGCGGCG CTCGCCCGCT GGGCCGAGGA CGTCTCCGTC 
GAGACCACGA AAAGCCTCGA GCACGCCGAG GAACTAGCCC GCTCGGCCGT CGCGGCGGGG 
CGGGTGACCG TCGCGCTGGG TGGTGACGGC CTGGTCGGCA GGGTGGCGGG CGCCGTCGCC 
CGGTCGGGCG GCGTGCTCGC GGTGCTGCCC GGCGGCCGGG GCAACGACTT CGCGCGAGGA 
CTGGGCATCC CGCGTGATCC GGCACTCGCC GCGACCGCGC TCGTCGCGGC CGTGGAGCGC 
AGGGTGGACC TGCCGGAGGC GAACGGGGTG CCGTTCGTCG GGATTGCCAG CCTCGGGTTC 
GACTCCGACG TCCAGGTGAT CGCGAACCGG ACGACCTGGC TGTCCGGCCA GAGCGTCTAC 
ACCTACGCGG CGTTGCGCGG GGTGGCGGCC TGGAAGCCGG CCCGGTTCAC CGTGACCATC 
GACGGCGAGC CGCCACTGGA GCACGTCGGG TGGACGGTCG GCGCGGCGAA CGGTCCGTAC 
TACGGCGGCG GGATGAAGTT CGCCCCGGAC GCCGACATCG CCGATGGCCG GTTGGAGATC 
GTCCTGGTCG CGCGCACCGG GCGGTTCACC TTCCTTCGGT TGTTCCCGCG CATCTTCTCC 
GGCCGGCACG TCGAGGTCCC CTACGTCCAG GTGCGGCGGG GCGAGCGGCT CGTCGTGGAC 
GCGGACCGCC CGTTCCAGGT CTACGCGGAC GGCGACCCGA TCGCCGACCT CCCGGCTGAG 
ATCGTCGTCC GGCCCGGGGC CCTGCGCCTG CTCACGCCGC CCCAGGCCTA A

Protein sequence

MTEPGTASSS TAARAEVPDA AVDRSRLTVV VNPKAGGGRA AKVLDGVRAA LARWAEDVSV 
ETTKSLEHAE ELARSAVAAG RVTVALGGDG LVGRVAGAVA RSGGVLAVLP GGRGNDFARG 
LGIPRDPALA ATALVAAVER RVDLPEANGV PFVGIASLGF DSDVQVIANR TTWLSGQSVY 
TYAALRGVAA WKPARFTVTI DGEPPLEHVG WTVGAANGPY YGGGMKFAPD ADIADGRLEI 
VLVARTGRFT FLRLFPRIFS GRHVEVPYVQ VRRGERLVVD ADRPFQVYAD GDPIADLPAE 
IVVRPGALRL LTPPQA