Gene Franean1_0220 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0220
Symbol
ID	5668645
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	268359
End bp	269465
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	78%
IMG OID	641239149
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001504593
Protein GI	158312085
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.854455
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.343267
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTGCGGT CGGTGGTCAC CGGCGCGGCC GGATTCCTCG GCGGCGCCGT GGCGCATGAG 
CTCCGTCGGC GCGGTGACGA GGTCATCGGG CTCGACGTGC GGCGTGCGCC GGGCGTCACC 
CTGGCCGACG TCACGATGTC CGGGAGCTGG GAGAAGGCGC TCGAGGGCGC TGACCTGCTC 
GTGCACGCCG CCGCCGTGGG CATGGGCGGC GTCGGGGAGC TGGCGCCGGT GCGGGCCGGC 
CGGGCGACCC CGCCCAGCGG GATCACCACC GCGCAGATGC GCAAGGTGCT GCTCGGCGGG 
ACCGCGACGG TGCTCGACGC GGCCCAGCGC GCTGGTGTCC GCCGCGTGGT CCACCTGTCC 
TGCGTGAGCG CGCTCGGCGA CGACGCACCG CACGCGGCCG ACGAGTCCGC GCCGGTCGGC 
CTCACCGGCG AGCCGCGCGC CGACGCGATC GCCGCCGCCG AGCAGACCGT CAGCGCGGCC 
GCCGCCCACG GGGCCCCCGT CACCGTGCTG CGGATCGCCG ACGCCTACGG CCCGCGCGCC 
GGCCGCTGGA CGCTGTGGCC CGTGCTGCTG ATGCGGGCCG GCCGGTTCGT CCTCGTCGAC 
GGCGGGCGCG GCATGCTGAG CCCCGTCCAC GTCGACGACG TGGTGAGCGC GGTGATGGCC 
GTCGCGGCCG CCCCGGGCGA GACGGTGACC GGCCAGGTGC TGCACGTGAC CGGTCCGGGC 
CCGGCGACGG TGGCCGAGTT CTTCGGGCGG TACGCCGCGA TGGCGCAGGT GCGGGCGCCC 
CGGTCCGTGC CTGCGCGGCT GTGCGAGGTC GTCGACGCCG TCGACCGGCT GCCGAGCCGG 
CAGCCGGCGT CCGCGGGCGG CCGTCCGGGC CTGCTGCGCG GGATCGGCGC GGCCCTCATG 
GCCAACGTGG ACCCGCGTGT CCGGGTCGAC CTCGGCCCGC TGACGATCCA GGACGTCACC 
AGGCGCGGCA CGGTCTCCGG GGACCGGATC GCCGCGCTCG TCGGCTGGCG GGGCGAGGTC 
GACCTCGACG AGGGCATGCG GCGGACGGGT TCCTGGCTGC GCGACCGGGG CCTGCTGGGG 
GTCCCGGAGC CGGCCCGCCG TGGGTGA

Protein sequence

MVRSVVTGAA GFLGGAVAHE LRRRGDEVIG LDVRRAPGVT LADVTMSGSW EKALEGADLL 
VHAAAVGMGG VGELAPVRAG RATPPSGITT AQMRKVLLGG TATVLDAAQR AGVRRVVHLS 
CVSALGDDAP HAADESAPVG LTGEPRADAI AAAEQTVSAA AAHGAPVTVL RIADAYGPRA 
GRWTLWPVLL MRAGRFVLVD GGRGMLSPVH VDDVVSAVMA VAAAPGETVT GQVLHVTGPG 
PATVAEFFGR YAAMAQVRAP RSVPARLCEV VDAVDRLPSR QPASAGGRPG LLRGIGAALM 
ANVDPRVRVD LGPLTIQDVT RRGTVSGDRI AALVGWRGEV DLDEGMRRTG SWLRDRGLLG 
VPEPARRG