Gene Franean1_0788 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0788
Symbol
ID	5669204
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	915311
End bp	916339
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	68%
IMG OID	641239716
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001505152
Protein GI	158312644
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.266201
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.21169
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGTGC TCGTCACCGG TACGGAGGGC TACCTGGGCT GCCTGCTTGC CCCGGAGCTG 
CTGCGCGACG GCCACGACGT GGTCGGGGTG GACACCGGTT ACTACAAGTA CGGCTGGCTC 
TACCGCGGCA CGGACCGTGT CCCGCACACG ATCGACAAGG ACCTGCGCGA CCTCACCGTC 
GAGGATTTCG AGGGCGTCGA CGCGGTCGTG CACATGGCGG AGCTGTCGAA CGACCCGCTG 
GGCGCGCTGG CACCCGACGT GACCTACAAG GTGAACCACC AGGGGTCCGT GCGGCTCGCG 
AAGCTGGCGA AGCAGGCCGG CGTCCAGCGG TTCGTCTACA TGTCGTCGTG CAGCGTCTAC 
GGCGTCGCGA CCGGGTCGGA CGTCACGGAG ACCTCGCCGG TCAACCCGCA GACGCCGTAC 
GCCGAGTGCA AGGTCTACGT CGAGCGGGAC GTCGCGCCGC TGGCGGACGA CACCTTCTCA 
CCGACGTTCC TGCGCAACGC CACCGCGTAC GGCGCCTCGC CGCGGATGCG GTTCGACATC 
GTGCTGAACA ACCTGGCCGG GGTCGCCTGG ACCACGAACG AGATCGCGAT GACCTCGGAC 
GGCACCCCGT GGCGCCCGCT GGTGCACGGC CTGGACATCG CCAAGGCGAT CCGGTGCGTG 
CTCACCGCGC CGCGCGACGC CGTCCACAAC GAGATCTTCA ACGTGGGTGA CAGCGCGCAG 
AACTACCAGG TGAAGGAGAT CGCGGACGCG GTCGCCACCG TCTTCACCGG CTGCAAGCTG 
AGCTTCGGCG ACAACGGCGG GGACAACCGC AGCTACCGGG TGTCGTTCGA CAAGATCGCC 
TCCCAGCTCC CGGGCTTCTC CTGCGACTGG GACGCGCACA AGGGAGCCGA GCAGCTCCAC 
GAGGTGTTCA GCCGCATCCA GCTCGACACC GAGACGTTCA CCGGCCGCGG GCACACCCGG 
CTCAAGCAGC TGCAGTACCT GATCGGCACC GGCCAGGTCG ACGCCGAGCT GTTCTGGACC 
GCCCGGTGA

Protein sequence

MKVLVTGTEG YLGCLLAPEL LRDGHDVVGV DTGYYKYGWL YRGTDRVPHT IDKDLRDLTV 
EDFEGVDAVV HMAELSNDPL GALAPDVTYK VNHQGSVRLA KLAKQAGVQR FVYMSSCSVY 
GVATGSDVTE TSPVNPQTPY AECKVYVERD VAPLADDTFS PTFLRNATAY GASPRMRFDI 
VLNNLAGVAW TTNEIAMTSD GTPWRPLVHG LDIAKAIRCV LTAPRDAVHN EIFNVGDSAQ 
NYQVKEIADA VATVFTGCKL SFGDNGGDNR SYRVSFDKIA SQLPGFSCDW DAHKGAEQLH 
EVFSRIQLDT ETFTGRGHTR LKQLQYLIGT GQVDAELFWT AR