Gene Franean1_5229 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5229
Symbol
ID	5673563
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6279484
End bp	6280590
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	72%
IMG OID	641244083
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001509493
Protein GI	158316985
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.529473
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGTGC TGGTAGTCGG CGGAACCGGG CCGACCGGGC CGCACATCGT GCGAGGCCTG 
CTCGGTAGGG GGCACGACGT CACGATCTTC CACCGGGGAG CCCACGAGCC GCCGGAGCTC 
GCCGACGTCG AGCACATCCA CGGCGATCCG CATTTCCGGG AGTCGATCGA CGAGGCGCTC 
GGCTTACGGG AGTTCGACGT CGTCCTGGCC ATGTACGGGC GGATGCGGCA TCTGTCGCCG 
GCGCTCGCCG GGCGGTGCGG CCAGTTCGTC GGCATCGGCG GCGTGCCGAT CTACCAGGGG 
TTCTTCCCGG GTGACGGGAG GCACCGGCTG CCGATCCCGG TGACCGAGGA GCACCCCGTC 
GTCCAGGAGC GGTCCGACGA CCCGGCCGTC CGGTTCTCCC GGCGGCTCGT CGACGCGGAG 
GAGGCGGCGT TCGCGCACCA TCCGGGCGCC ACGCTCTTCC GTTTCCCCAT GCTTTACGGG 
CCGAACAACG CCCGGCCGGC CGAGTGGTCG ATCGTGCGGC GCGTGCGCGA CGGGCGCCCG 
TACATCATCC TTCCGGACGG CGGATCCCAG ATCCACACCC GCTGCGCGGC GCGCAACGCG 
GCGGCGTTCG TGCTCGCCGC GGTCGACCGC CCGCAGGCCG CCGCCGGTCA GATCTACAAC 
GCCGGTGATC CCACCGACTG GTCGCTGCGG CAGTGGGTCG AGTTGATCGT CCGCCTGATG 
GGCGCGGATC TCGAGGTGGT GGCGCTGCCG AGGGAGATCG CCGTCGAGGC CACGACGACG 
CTGCTGCCGC TGGCGGGCAC GACGACGGAG CACTGCGTCC TGAGCACCGA GAAGGCGCGC 
CGCGAGCTCG GCTGCGAGGC GGTGATCGAC ACGGTCCAGG CGGTCGAGGA GCTCCTGGCG 
TGGTACGCCG AGCGACCCGG CTTCGACGTC AGCACCAGCC CGTCGTTCAC CGACCGGTTC 
GACTACGCGA CCGAGGACGC CCTGGTCGCC GAGTACCGGT CCGCCCTCGA CCGGGTGCAC 
TCGGCCGTCG ACCAGTACGT CGCGCCACCG GTGCACAGCA TGCCGCACCC GACCGAGCCC 
GGGAAGGTGG ACCACCGTGG CCGCTGA

Protein sequence

MKVLVVGGTG PTGPHIVRGL LGRGHDVTIF HRGAHEPPEL ADVEHIHGDP HFRESIDEAL 
GLREFDVVLA MYGRMRHLSP ALAGRCGQFV GIGGVPIYQG FFPGDGRHRL PIPVTEEHPV 
VQERSDDPAV RFSRRLVDAE EAAFAHHPGA TLFRFPMLYG PNNARPAEWS IVRRVRDGRP 
YIILPDGGSQ IHTRCAARNA AAFVLAAVDR PQAAAGQIYN AGDPTDWSLR QWVELIVRLM 
GADLEVVALP REIAVEATTT LLPLAGTTTE HCVLSTEKAR RELGCEAVID TVQAVEELLA 
WYAERPGFDV STSPSFTDRF DYATEDALVA EYRSALDRVH SAVDQYVAPP VHSMPHPTEP 
GKVDHRGR