Gene Franean1_5124 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5124
Symbol
ID	5673458
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	6138483
End bp	6139841
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	77%
IMG OID	641243974
Product	zeta-phytoene desaturase
Protein accession	YP_001509388
Protein GI	158316880
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1233] Phytoene dehydrogenase and related proteins
TIGRFAM ID	[TIGR02734] phytoene desaturase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.229738
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0794369
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGAGG TGTTCGAGGA GCTGTTCGCC GCCACCGGCG GGCCGCTCGG CGCGCAGCTC 
ACGCTGCGCC GCCTCGACCC GATCGCCGCC TACCGGTTCG CCGACGGGAC GGCGGTGACC 
GCGCACGCCG ACGACGCCGC GTTCCACGCG GAGCTGGACG CGAGGCTGGG CGCCGGGGCC 
GGGGCCCAGT GGCGGCGCCT CGACGAGCGC GCCCGCCGGG TCTGGGCGGT GTCCGAACAG 
CCCTTCCTGC GCAGCCCGGT CTCGGCCGCG GCGCTGGCAC GGACCGCCGC GCGCCGCCCG 
CTGGGGCTGG TCACCGTCGC GCCCGGCACC ACCCTGCGCG GTATCGGGCG CCGTCACCTC 
ACCGATCCGC GGCTGCGCAT GATGCTGGAC CGGTACGCGA CCTACACCGG CTCGGATCCG 
CGCCGGGCGC CGGCCGCGCT GGTCACGGTC CCGCACGTGG AGCGACGGTT CGGCGGCTGG 
TACGTCCCGG GCGGGCTGCG GCTGCTCGGG CAGGCGATCG CCGAGCGGGC GGCCGAGCGC 
GGCGCGGTGA TCCGCATCGG CGCGCCGGTC GCGCGGATCA CCCGCACGCC GGGGGGGTGG 
GTGGACGGCG TCCGCCTGGC CGACGGAACG CTGCTGGGTG CCGACCTGGT CGTGTCCGAC 
GTCGACGCGG CCCGGCTCTA CGACGGCGCA CCTCCCGCAG CGCCCGGGCG GGCCGGCCCG 
CGCCCGCTCG TCGACCATCC GGCCAGCCGG CGGCGGATCC GGCGGCTGGC GCCGTCGCTG 
TCCGGTTTCG TCCTGCTGCT GGCACTGCGC GGGCGGACGC CGGGCCTGGC CCACCACACC 
GTGCTGTTCC CCGCCGACTA CGAAGACGAG TTCAACGCGG TCTTCGGTGG CCGGCTGGCC 
TGGGATCCGA CCGTCTACAT CGCCGCGCCG GACGACCCGG CGACCGCGCC GCCGGGCGAC 
GAGGCGTGGT TCGTCCTGGT GAACGCCAGC CCGCACGCCG CCGCCACTGC CGCTGCCGGC 
CCGCGGGGTC CCGGTGTGGA CTGGGACCGG CCCGGGCTCG CCGACGCCTA CGCCCGCCGC 
ATCCTCGAGG TGCTGGCCTC ACGTGGGCTC GACGTCCGCG CCCGGGTGCG CTGGTACCGG 
ACGATCTCGC CGGCCGACCT CGCACGCGCG ACCGGCGCCG TGGGCGGCTC GATCTACGGC 
GTGTCCTCCA ACGGGCCGCG GTCGGCGTTC CTACGCCCGC GCAACCGCTC GCCGGTACCC 
GGGTTGTTCC TGGTCGGCGG CTCGGCCCAT CCGGGCGGCG GGCTGCCGCT GGTCACGCTC 
TCCGCGAAGA TCGTCGCCGA TCTCATCGGC CCGGCCTGA

Protein sequence

MPEVFEELFA ATGGPLGAQL TLRRLDPIAA YRFADGTAVT AHADDAAFHA ELDARLGAGA 
GAQWRRLDER ARRVWAVSEQ PFLRSPVSAA ALARTAARRP LGLVTVAPGT TLRGIGRRHL 
TDPRLRMMLD RYATYTGSDP RRAPAALVTV PHVERRFGGW YVPGGLRLLG QAIAERAAER 
GAVIRIGAPV ARITRTPGGW VDGVRLADGT LLGADLVVSD VDAARLYDGA PPAAPGRAGP 
RPLVDHPASR RRIRRLAPSL SGFVLLLALR GRTPGLAHHT VLFPADYEDE FNAVFGGRLA 
WDPTVYIAAP DDPATAPPGD EAWFVLVNAS PHAAATAAAG PRGPGVDWDR PGLADAYARR 
ILEVLASRGL DVRARVRWYR TISPADLARA TGAVGGSIYG VSSNGPRSAF LRPRNRSPVP 
GLFLVGGSAH PGGGLPLVTL SAKIVADLIG PA