Gene Franean1_6561 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6561
Symbol
ID	5674876
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	7980567
End bp	7981616
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	66%
IMG OID	641245410
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001510804
Protein GI	158318296
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATTC TTGTGACCGG ACACGACGGA TATATAGGAA CCCGCCTCGT CCCGTTCCTC 
CGGCAAGCCG GCCATGACGT CGCCGGCCTG GACAGCATGC TGTTCTCCGA CTGCACGCTC 
GGGACCGAAC CGGACTCCGT GCCGGCGCTC GCCCTCGACA TCCGCGACGT CCGCCCCTCC 
CATCTGGAGG GGTTCGACGC CGTGATTCAT CTGGCCGGAA TCTCCAACGA CCCACTGGGA 
GATCTCAATC CCCGCACCAC CTACGACATC AATGCACGCG GGACGTTGAT GATCGGCAGC 
GCGGCCAGGC AGGCCGGCGT GCCGCGATTC GTCTTCTCGT CCTCCTGTAG CCTTTATGGC 
GCCCATGGGG ACGCCCCCAT CGACGAATCC GCCGAGTTCC ATCCGGTGAC GCCGTACGGG 
GAGTCGAAGG TGATCGCCGA ACGCGAGCTC ACCGCGCTCG CCGACGATGG TTTCAGTCCG 
GTCTTCCTCC GCAACGCGAC CGCCTACGGG GTGTCACCCA GACTGCGCGG CGACCTGGTG 
GTCAACAACC TGACGGGATA TGCGGTCACG ACCGGCAAGG TGTACCTCAA GAGCGACGGG 
ACGCCATGGC GTCCGCTGGT CCACATCGAG GACATCGCCC GGGCGATGCT CGCGGTCTGC 
GAGGCACCGC GGGAGGCGAT CCATTGCAAG GCGTTCAACG TCGGCCGGTC GGGCGAGAAC 
TACCGGATAC GTGAGGTCGC CGAGATCGTC GAGGATGTCG TACCTGGCAG CCGGGTTGTC 
TTCGCCGACG AGGCCGGACC GGACAAGCGG AACTATCGGG TCGATTGCGA CCGCATCGCA 
CGGGAGATAC CCGGATTCCA GCCGGTGTGG ACGGTGCGCA AGGGCGTGGA GGAGCTGCAC 
GCCGCCTACC TGGCAGCCGA GCTGGCCAAG GAGGACCTGA TCGGGGCGCG CTTCCAGCGG 
ATCCGGCGCA TCCAGGAGCT CATGGCGGAA GGTCTACTCG ACAACTCCCT GCGGCCGATC 
AGAAGGGAGC GGGTGCCATG CGCGACCTGA

Protein sequence

MRILVTGHDG YIGTRLVPFL RQAGHDVAGL DSMLFSDCTL GTEPDSVPAL ALDIRDVRPS 
HLEGFDAVIH LAGISNDPLG DLNPRTTYDI NARGTLMIGS AARQAGVPRF VFSSSCSLYG 
AHGDAPIDES AEFHPVTPYG ESKVIAEREL TALADDGFSP VFLRNATAYG VSPRLRGDLV 
VNNLTGYAVT TGKVYLKSDG TPWRPLVHIE DIARAMLAVC EAPREAIHCK AFNVGRSGEN 
YRIREVAEIV EDVVPGSRVV FADEAGPDKR NYRVDCDRIA REIPGFQPVW TVRKGVEELH 
AAYLAAELAK EDLIGARFQR IRRIQELMAE GLLDNSLRPI RRERVPCAT