Gene Franean1_4678 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4678
Symbol
ID	5673020
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5587369
End bp	5588532
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	72%
IMG OID	641243535
Product	mandelate racemase/muconate lactonizing protein
Protein accession	YP_001508951
Protein GI	158316443
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.194789
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATCG CCGACGTGCG GACGCACGTG TACGGGACCC CGTGGCGGGA TCTGACCTAC 
GTCCAGGTCT TCACGGACGA CGGTCTGGTC GGCGTAGGAG AGACCCGGAT GCTCGGCCAC 
ACCCAGGCGC TGCTGGGCTA CCTGGCCGAG GCGACCCGCA ACCATGTGCT CGGCTCCGAT 
CCGTTCGACA TCGAGTCACT GGTCGACCGG ATGAAGCGCG GCGACTACGG GCGGGCCGGC 
GAGATCGTCA TGTCCGGTAT CGCGTGCGTC GAGATGGCCT GCTGGGACAT CGTCGGCAAG 
GCGCTGGGGC AGCCGGTGTG GCGGCTGCTG GGCGGCAAGG TCCGCGACCG GATCAAGGCG 
TACGCCAACG GCTGGTACAC CGTCGAGCGC ACCCCCGAGG AGTTCCACGC GGCGGCGCGG 
GCGGTGGTGG ACCGGGGCTA CCGGGCGCTC AAGCTCGACC CGTTCGGGGC CGGCCGGTGG 
GAGCTGGACC GGGCCGAACG TCGCCACTCC ATCTCCCTGG TCGAGGCGGT GCGCGACGCG 
GTCGGGCCGG ACGTGGAGAT CCTCGTCGAG ATGCACGGGC GGTTCGCCCC ACACGAGGCG 
ATCCGGATTG CCGCCTCACT GACCGAGTTC GAGCCGGGCT GGGTCGAGGA GCCGGTACCA 
CCGGAGAACC TGCGGGCGCT GGCCAAGGCC GCCGCCGGGA TCGACGCCCC GGTGGCGACC 
GGGGAGCGCA TCCACGACCG CACCGAGTTC CGGGAGCTGT TCGACCTCGG CGCGGCCGAC 
ATCATCCAGC CCGACATCGG CCATCTCGGT GGCATCAGCG AGACCCGCAA GCTCGCCGCG 
ACCGCAGAGA CCCACTTCAC GCTGGTCGCC CCGCACAACG TCGGCGGCGC GGTTCTCACC 
GCCGCCAACC TGCACCTGGC CGCCTGCACC CCCAACTTCA TGATCCAGGA ACACTTCAAC 
GACTTCGCCG ACGAGGAGGT CAAGCTCGCG GCGCCGGGCC TGCCGCCGGT CGTCGACGGC 
TACTTCGCCC TGCCGACCGC ACCCGGCCTC GGCGTCGAGC TGGACGTCGA CGTCGTGGCC 
GCCCACCCGT CCCGCGGCGC CCACTTCGAC CTCTACGCCG ACGGCTGGGA GCTGCGCGGC 
TCCCGCCCGC CCGGCCGCGG CTGA

Protein sequence

MKIADVRTHV YGTPWRDLTY VQVFTDDGLV GVGETRMLGH TQALLGYLAE ATRNHVLGSD 
PFDIESLVDR MKRGDYGRAG EIVMSGIACV EMACWDIVGK ALGQPVWRLL GGKVRDRIKA 
YANGWYTVER TPEEFHAAAR AVVDRGYRAL KLDPFGAGRW ELDRAERRHS ISLVEAVRDA 
VGPDVEILVE MHGRFAPHEA IRIAASLTEF EPGWVEEPVP PENLRALAKA AAGIDAPVAT 
GERIHDRTEF RELFDLGAAD IIQPDIGHLG GISETRKLAA TAETHFTLVA PHNVGGAVLT 
AANLHLAACT PNFMIQEHFN DFADEEVKLA APGLPPVVDG YFALPTAPGL GVELDVDVVA 
AHPSRGAHFD LYADGWELRG SRPPGRG