Gene Francci3_1564 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1564
Symbol
ID	3904796
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1876245
End bp	1877285
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	65%
IMG OID	637878901
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_480669
Protein GI	86740269
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.697204
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTATTC TGGTCACCGG ACACGACGGA TATATAGGAA CCCGTCTCAT CCCGCTCTTC 
CGGGCTGCCG GACACGATGT GGTGGGTCTG GACAGCGGAC TGTTCTCCGG GTGTACCCTC 
GGACCCGATC CGGACTTCGT GCCGGCGTTG AAACTTGATA TTCGGGACGT CCGGCCGTCC 
CAGCTGGAGG GTTACGACGC GGTGGTCCAT CTGGCGGGCA TATCCAATGA TCCGCTGGGT 
GATCTGAACC CAGCCGTGAC CTATGACATC AACGCCCGGG GGACGTTGCT GGTTGGGCGT 
GCCGCCAAGG CCGCGGGCGT ACCGCGTTTC GTCTTCTCGT CCTCGTGCAG CCTCTATGGT 
GCGCACGGAG ACGCGCCCAT CGACGAGTCG GCCGAGTTTC ATCCGGTGAC TCCCTACGGC 
GAGTCAAAAG TGATCGCCGA ACGAGAGCTC GCCGAGCTTG CCGATGACGA TTTCAGCCCG 
GTCTTCCTGC GTAACGCCAC GGCGTACGGC GTCTCACCCC GACTGCGTGG TGATCTTGTG 
GTGAACAATC TCACCGGCTA CGCGGTGACG ACCGGCGAGG TTTACCTCAA GAGCGACGGG 
ACGCCGTGGC GGCCGCTGGT ACACATCGAG GACATCGCCC GGGCGATGCT CGCCGTGTGC 
GAGGCGCCCC GCGAGAAGAT CCACCTCAAG GCCTACAATG TCGGCCGGTC GGCGGAGAAC 
TATCGGATAC GCGACGTGGC CGCGATCGTC GAGGAGGTCG TGCCGGGCGG CCGGGTGGTC 
TTCGCGGACA CGGCCGGGCC GGACAAGCGG AACTACCGGG TGGACTGCGA CCGTATCGCC 
GAGGAGATAC CGGGATTCCG GCCGGTGTGG ACCGTCCGCA AGGGGGTCGA GGAGCTCTAC 
CTGGCCTACG TCGCCGCCGG GCTGACCAAG GAGGAGCTGA TCGGCTCCCG CTTCCAGCGG 
ATCCAGCGCA TCCAGCAACT CATGGCGGAC GGTCTGCTCG ACGTCACCCT GCGGTCGGCC 
GCACCGATGC GGGTGCCATG A

Protein sequence

MRILVTGHDG YIGTRLIPLF RAAGHDVVGL DSGLFSGCTL GPDPDFVPAL KLDIRDVRPS 
QLEGYDAVVH LAGISNDPLG DLNPAVTYDI NARGTLLVGR AAKAAGVPRF VFSSSCSLYG 
AHGDAPIDES AEFHPVTPYG ESKVIAEREL AELADDDFSP VFLRNATAYG VSPRLRGDLV 
VNNLTGYAVT TGEVYLKSDG TPWRPLVHIE DIARAMLAVC EAPREKIHLK AYNVGRSAEN 
YRIRDVAAIV EEVVPGGRVV FADTAGPDKR NYRVDCDRIA EEIPGFRPVW TVRKGVEELY 
LAYVAAGLTK EELIGSRFQR IQRIQQLMAD GLLDVTLRSA APMRVP