Gene Franean1_3971 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3971
Symbol
ID	5672332
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4753155
End bp	4754561
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	75%
IMG OID	641242850
Product	putative phytoene dehydrogenase (phytoene desaturase)
Protein accession	YP_001508267
Protein GI	158315759
COG category	[C] Energy production and conversion
COG ID	[COG0644] Dehydrogenases (flavoproteins)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.163754
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.262975
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCCGGCG GCGGGAACGT GCCCGGGGCC GGGAGCGCCA CGGTCGGTGG GGGAGTGGGC 
CGGCGAGGGC ACGCCGTCGT GCTCGGCGCC AGCGTCGCGG GCCTGTTGGC GGCCCGGGTG 
CTGGCCGAGC ACGTCGGCCA GGTGACGGTC ATCGACCGCG ACGACGTCAC GCCCACCGCT 
GCCGTCGCCC ACCGCGGCGG GGCGGCGCAG GGCCGTCACC TGCATGCCCT GATGGAACGG 
GGCCGCCAGA TCCTCGACGA GCTGTACCCG GACTTCACCG CCAAGATCGC CGCAGACGGG 
GTGCCGACGG CGGAGACCCT CGTCGGTACC CGCTGGTACT TCGACGGCGC CCGGGTCACC 
CCGGTGCCGA CCGGCCTCAC CTCGGTGCTC GCCAGCCGGC CGGCGCTGGA GGCCGCCCTG 
CGGGCCGCGA CACTCGGCCA CGACCGGATC CGGCTGCTCC CCGGGCTCCG GGCGGTCGGC 
CTCGTCCGCG GATCGGGCTC CACCCGAGCC GCCGGGGTCG TCGGGGTGCG CGTCGAGCCG 
CCCGCCGGTG ACGCCCCGGC CCGCACCATC GAGGCCGACC TCGTCGTCGA CGCCACCGGC 
CGCGGGTCCC GCGCCTCGGA GTGGCTCGCC GACCTGGGCT TCGACGTCCC ACGGGAGGAG 
ACCGTCGGCG TCGACCTCGC CTACGCCTCC CGGACCTACC GCCGGCGGCC CACGGACCTC 
GGCGGCGACC TCGGCGTCAT CATCTCGACG CTGCCGGGCC GGCGCGGCGG TGGCGCCGTC 
ACCCAGGAGG GCGACCGCTG GATCGTGACC CTCGCCGGCA TGCTCGGCGA CCACCCGCCG 
GTCGACGTCC CCGGCTACGA ACGGTTCGCG GCCTCCCTGC CCGCCCCCGA CATCAACCGC 
CTCATCCAGG ACGCCGAGCC GCTCGACGAC CCGGTTCGCT ACCGGTTCCG GGCGTCACGG 
CGGCTGCGCT ACGACCTCCT GCGCACCCCG GCCGCCGGTT TCGTCGCGAT CGGCGACGCC 
CTGTGCACCC TCAACCCGCT CTACGCGCAG GGCATGACCG TCGCCGCGCA GCAGGCTCTC 
GAGCTGCGGG CATGTCTGCG TTCGGGTGGC CTGGACGACC TCGCCGCACG ATACTTCACG 
GCGGCCGCCC GGCCGACCTC CCGGGCGTGG TCGATCGCCA CCGACTCCGA CCTGCGCTAC 
CGGGAGGTCG AGGGCCGCCG CGGGCCCCGC ACCCGGATCA CCAACGCTTA CATCCCCCGA 
GTCCAGGCGG CGACCCGATC CGACCCTGTC CTCGCCCGCA ACCTGCTGCG CGTGGTCAAC 
CTTGTCGAAC CCCCATCAGT CCTGCTCACC CCAGCGGCCG TGCTGCGGAC CGCCCGACAC 
GCACTTACCC GGCGTGGTCA ATCATGA

Protein sequence

MPGGGNVPGA GSATVGGGVG RRGHAVVLGA SVAGLLAARV LAEHVGQVTV IDRDDVTPTA 
AVAHRGGAAQ GRHLHALMER GRQILDELYP DFTAKIAADG VPTAETLVGT RWYFDGARVT 
PVPTGLTSVL ASRPALEAAL RAATLGHDRI RLLPGLRAVG LVRGSGSTRA AGVVGVRVEP 
PAGDAPARTI EADLVVDATG RGSRASEWLA DLGFDVPREE TVGVDLAYAS RTYRRRPTDL 
GGDLGVIIST LPGRRGGGAV TQEGDRWIVT LAGMLGDHPP VDVPGYERFA ASLPAPDINR 
LIQDAEPLDD PVRYRFRASR RLRYDLLRTP AAGFVAIGDA LCTLNPLYAQ GMTVAAQQAL 
ELRACLRSGG LDDLAARYFT AAARPTSRAW SIATDSDLRY REVEGRRGPR TRITNAYIPR 
VQAATRSDPV LARNLLRVVN LVEPPSVLLT PAAVLRTARH ALTRRGQS