Gene Franean1_6012 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6012
Symbol
ID	5674333
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7332346
End bp	7333881
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	78%
IMG OID	641244860
Product	carbohydrate kinase, YjeF related protein
Protein accession	YP_001510262
Protein GI	158317754
COG category	[G] Carbohydrate transport and metabolism [S] Function unknown
COG ID	[COG0062] Uncharacterized conserved protein [COG0063] Predicted sugar kinase
TIGRFAM ID	[TIGR00196] yjeF C-terminal region, hydroxyethylthiazole kinase-related [TIGR00197] yjeF N-terminal region

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0524001
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.189514
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGAAG CACATACTGT TGCCGAGGTC CGGGACGCCG AGGCGCCCCT GCTCGCGTCC 
CTGCCCTCCG GCGGGCTCAT GCAGCGCGCC GTGTCCGGTC TCGTCTCGCA CGCGGTCCGC 
CGCGTCGACC GGGTGTACGG CGCCCGGATC GTCGTCCTCG CCGGTTCCGG TGACAACGGC 
GGTGACGCGC TGTGGGCCGG TGCCCGGCTG GCAGCTCGCG GCGCCCGCGT CCACGCCCTC 
GCTCCCGGCC GGACCCATCC CGAGGGCACG GCCGCCCTCC TCGCGGCCGG CGGGCGGCTG 
CACCGCACCG GCCCGGTCGA CCCGCCCGCA CCGGAGGGGA TGGGCGCCGA CGCGGCCGCC 
GACCTCCTCG ACTCCGCCGA CCTCGTCCTG GACGGGCTGC TCGGCATCGG CGGCCGCGGC 
GAGCTGCGCG AGCCGTACGC CCAGCTCACC ACGCTCGCGC CGGCCCGGCG GACGGTGGCC 
GTGGACGTGC CCAGCGGGGT CGACGCGGAC ACCGGCGCGG TGGCGGAGGG GGCCGTGCGC 
GCGGCCGGCA CCGTCACCTT CGGCACGTAC AAGCGCGGCC TGCTGGTCGG ACCCGGAGCT 
GTCCATGCCG GGCGGGTCGA GCTGGTCGAC ATCGGGCTGA CCCTGCCCGA GCCCGACCTA 
CGTGCCCTGC AGGACGTCGA CGTGGCCCGG CTGTTGCCCG TCCCGGTCGC GGCCGACTCG 
AAGTACTCCC GCGGCGTGCT CGGGCTCGTC GGCGGCAGCG ACCGGTACCC GGGAGCCGCG 
GTGCTGGCGG TCGGCGGCGC GCTGCGCGGC GGCGCGGGCT ACCTGCGGGT GGTCGCCGAG 
GCCGGCGCCG CCGAGTACGT CCGCCGGGCC CACCCGGAAT CCGTGCTGAC GGTGATCGAG 
GCGGGGGACG CGGAGGCGAT GCTCGGGGTG GGCCGGGTCC AGGCGTGGGC GATCGGCCCC 
GGCCTCGTAC CGGACGAGGC CACCCGGCGC CTCGTCGACG CGCTGCTCGA GCAGACCGAG 
AGCGGCCTGC TCGTGGACGC CGGCGCGCTG GACACACTCG CGGCCGCCGT CGCCGCCCGC 
CCGGCGGTGC TGCGGGACCG CGCGGGCGCC GTCGTCCTGA CCCCGCACGA GGGCGAGTTC 
ATCCGGCTGA CCGGCACGGC ACTCGGCTGG GACCAGGCCG GCACACCTGA GCGCCTGCGG 
GCCGACCGTC TCGGCACCGT CCGCCAGGCG GCGCGGGACC TCGGCGCCGT CATCCTGCTG 
AAGGGCAACC GGACGATCAT CGCCGCCCCC GGCGGGGAGG CCCTCGTCAA CCTCACCGGG 
ACGCCATGGC TGGGAACGGC CGGATCCGGT GACGTTCTCA CCGGACTCGC CGGTTCCCTG 
CTGGCCGCGG GCCTGCCGGC GCCGCACGCG GCCGCCGTGG GCGCGTTCCT GCATGGCCGG 
GCGGGGGAGC GCGGGCCCGT GCCGCTCGCC GCCGCAGACC TGCCCGCGCT CCTGCCCGGG 
GTCGTCGAGG ACCTGCTTGC TAGCGTCGAG GGGTGA

Protein sequence

MLEAHTVAEV RDAEAPLLAS LPSGGLMQRA VSGLVSHAVR RVDRVYGARI VVLAGSGDNG 
GDALWAGARL AARGARVHAL APGRTHPEGT AALLAAGGRL HRTGPVDPPA PEGMGADAAA 
DLLDSADLVL DGLLGIGGRG ELREPYAQLT TLAPARRTVA VDVPSGVDAD TGAVAEGAVR 
AAGTVTFGTY KRGLLVGPGA VHAGRVELVD IGLTLPEPDL RALQDVDVAR LLPVPVAADS 
KYSRGVLGLV GGSDRYPGAA VLAVGGALRG GAGYLRVVAE AGAAEYVRRA HPESVLTVIE 
AGDAEAMLGV GRVQAWAIGP GLVPDEATRR LVDALLEQTE SGLLVDAGAL DTLAAAVAAR 
PAVLRDRAGA VVLTPHEGEF IRLTGTALGW DQAGTPERLR ADRLGTVRQA ARDLGAVILL 
KGNRTIIAAP GGEALVNLTG TPWLGTAGSG DVLTGLAGSL LAAGLPAPHA AAVGAFLHGR 
AGERGPVPLA AADLPALLPG VVEDLLASVE G