Gene Franean1_1500 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1500
Symbol
ID	5669904
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1802424
End bp	1803725
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	72%
IMG OID	641240420
Product	diacylglycerol kinase catalytic region
Protein accession	YP_001505846
Protein GI	158313338
COG category	[I] Lipid transport and metabolism [R] General function prediction only
COG ID	[COG1597] Sphingosine kinase and enzymes related to eukaryotic diacylglycerol kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0397379
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCCGAT CCCGGCGGGC GGCGGCTTCA GTGGCGTTGG TGAGCTTCAC CGCGGCGGTC 
GCGGTCATTG TCGCCCGGCT GATCGACCGG CCGATTGCCC TGCCGGTTTC GGTCGCCGCT 
GTGACGATCG CGTTGGTAGC GGGCTGGACG GCGCTGGTCG GACGGGGGCT GCGCCGCCTG 
AGCGCGGCTG TCGTGGCGGC CTTCGCGCTC GGCGGCCTGA TCGTCTTCGC GGGGGTGGTC 
GGCCTGACCA CCGTGCTGGT CACCGTGTGC CTGCTCGTCA CGTCGGGAAC CGCGGCGCGC 
GGAGCCTTCG GGCGGCACCG GCCGAAAGGG ATCATGGCTG GAGCCGCCCG CCGCGGTGTC 
CTGCTGGTGA ACCCGCGTTC CGGGGGCGGC GCCGCCGACC GCCACAATCT CGCCCAGGAG 
GCCGCCCGGC GCGGGATCGC GGTCGTGACC CTCACGCCAG GCGCTGATCT GCGCTCCCTC 
GCCGAGGACG TCGCCGACCG CGGAGCCGAC GTGGTGGGCA TGGCGGGTGG CGATGGTTCG 
CAGGCGGTCG TCGCCGACGT GGCGCGGCGG CGCGGGATGG CCTTCGTCTG TGTCCCAGCC 
GGTACTCGTA ACCACTTCGC CCTTGACCTC GGCCTCGATC GGAAGGATGT CGCGGGGGCG 
CTCGACGCGT TCGACCTGGC TGTCGAGCAG CGCGTTGACC TCGGTCAGCT CGGTGACCGC 
GTGTTCGTCA ACAACGTCTC GTTGGGCGTC TACGCCGAGA TCGTGCAGTC CGACAGCTAC 
CGTGACGCCA AGATGGGAAC GGCGGCCGCG AGGCTGCCTG ACCTTCTGGG CCTGGACCGC 
GCTCCGCCGG ATCTTCGCTT CACCGGCCCG GACGGCCGCG CCGGATCGAC CGCGGACGTT 
CTGCTCGTGT CCAACAACGC CTACCAACTG CACAGTCTTG GTGGTTTCGG CACCCGGCCC 
CGGCTCGACG GCGGCCGGCT TGGCATGGTG GCATTGCGCG TCGATCGCGC CCGCGACCTA 
CCCGTACTCG TCGCGCTCGA GTCCGTGGGT GCCATCAGCC GGTTCCGTGG TTTCCACCAG 
TGGACCAGCC CCACGATGCG GGTCGACTCC GCGCGACCGG TCAGCGTCGG CGTGGACGGG 
GAGGCGCTGT GCCTGCCGCC ACCGCTGGAG CTGCGCTCGC TTCCGGCGGC TGTGCGCGTT 
CGGATTCCGC TGCACGCGCC CGGGGTCCCG ACCGTGCGGC CGGGTGTCTG GGAGATGTTC 
CCCGCGCTGA TCCGCATCGC GGGTGGCCGG TCGCCGGCAT GA

Protein sequence

MSRSRRAAAS VALVSFTAAV AVIVARLIDR PIALPVSVAA VTIALVAGWT ALVGRGLRRL 
SAAVVAAFAL GGLIVFAGVV GLTTVLVTVC LLVTSGTAAR GAFGRHRPKG IMAGAARRGV 
LLVNPRSGGG AADRHNLAQE AARRGIAVVT LTPGADLRSL AEDVADRGAD VVGMAGGDGS 
QAVVADVARR RGMAFVCVPA GTRNHFALDL GLDRKDVAGA LDAFDLAVEQ RVDLGQLGDR 
VFVNNVSLGV YAEIVQSDSY RDAKMGTAAA RLPDLLGLDR APPDLRFTGP DGRAGSTADV 
LLVSNNAYQL HSLGGFGTRP RLDGGRLGMV ALRVDRARDL PVLVALESVG AISRFRGFHQ 
WTSPTMRVDS ARPVSVGVDG EALCLPPPLE LRSLPAAVRV RIPLHAPGVP TVRPGVWEMF 
PALIRIAGGR SPA