Gene Franean1_5344 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5344
Symbol
ID	5673678
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6443510
End bp	6444568
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	71%
IMG OID	641244202
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001509608
Protein GI	158317100
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCTGC ATGTGATCAC CGGTGCCGGT GGCACCGGAG CCCCCACCGC CGAACTGTTG 
GCCCGGCAGG GTGATCGCGT CCGACTGGTC AGCCGGCGCG GGGGCGGACC CGAGCACCCA 
CTGATCGAGC GGATCGCCGC CGACGCGACC GACGCCGACG CGCTGACCCG ACTCGCCGAG 
GGCGCGACGA CGCTGATCAA CACCGCGATG CCGCCGTACG ACCGGTGGCC GGACGAGTTC 
CCACCGCTCG CGACGGCGCT GCTGGACGCG GCTGAACGCA CCGGCGCCGG CTACGTGATG 
ATGGGCAACA CCTACGGCTA CGGCATCGTC AACGGCCGCT TCACCGAAGA TCTACCGATG 
GCACCGGTAT CCGCCAAAGG TCAGGTACGG GCCCGGATGT GGAGCGACGC CCTCGAGGCG 
CACCGCGCGG GTCGAGCCCG CGTGACCGAG GTCCGGGCCT CGGCGTTTCT GGGCGCCGGG 
GCCGGTTCGC TGTACAACTT CACGGTGGCG CCCCTCGTCC TGCGCGGCGA GCCGGCAGCC 
TTCCCCGGCG ACCTGGACGC CCCGAAAACC TGGTCCTACG TCGGGGACGC CGCCCGAACC 
CTGGCCGCCG TGGCCCTCTC CGGCGACGAC CTTGCGTGGG GACGGGCGTG GCACGTGCCC 
TCCACCGCGG CCTTGTCCGT GCGGGAGCTG ACCACGCGGC TCGCGACCGC CGCCGGGGCG 
CCCGCACCCA TCCTGACGGC GATGTCCACC GATCAGCTCG CCGCGACCGG AGCCGTGAAC 
CCGATCATGC GGGAAGTCAT CGAGATGATG TACTCCCTGG AACAGCCCGA CCTGCTCGAC 
TCCACCCTCA CCGAGCAGAC GTTCCGCCTC GCCCCGACCC CCCTCGAGAC CGTCCTGGCT 
GAAACCGTCA GCGCCTACGG ACCTGTACCT GACCAGACCC TGACCACCTG TACCAGACCA 
GACCAGAACG GTCGGCAGAA TTCCGGGTCG GCACCGACCG CATCTCGCCG GCAATCAGAC 
GGTCACGTCG GCGACAGTAC CGCCGTCCGG GGAACGTAA

Protein sequence

MPLHVITGAG GTGAPTAELL ARQGDRVRLV SRRGGGPEHP LIERIAADAT DADALTRLAE 
GATTLINTAM PPYDRWPDEF PPLATALLDA AERTGAGYVM MGNTYGYGIV NGRFTEDLPM 
APVSAKGQVR ARMWSDALEA HRAGRARVTE VRASAFLGAG AGSLYNFTVA PLVLRGEPAA 
FPGDLDAPKT WSYVGDAART LAAVALSGDD LAWGRAWHVP STAALSVREL TTRLATAAGA 
PAPILTAMST DQLAATGAVN PIMREVIEMM YSLEQPDLLD STLTEQTFRL APTPLETVLA 
ETVSAYGPVP DQTLTTCTRP DQNGRQNSGS APTASRRQSD GHVGDSTAVR GT