Gene Franean1_3470 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3470
Symbol
ID	5671841
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4099763
End bp	4100977
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	73%
IMG OID	641242358
Product	cytochrome P450
Protein accession	YP_001507778
Protein GI	158315270
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0620803
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.682712
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGCA ACCAAGCGGT CGTGGCGACT CCGCCCGCCT TTCCCATGGA CCGTGGATGT 
CCTTACCACC CGCCGGCCGG GTACGCGCAG CTCCAGCAGG ACGGGCCGAT CACCCGGGCG 
ACGCTGTTCG ACGGCCGGGA GGTGTGGGTG GTCACCGGCT ACGAGGAGGC CCGCCGGCTC 
CTCGTCGACC CGCGGCTGTC CTCGGACCGT TCCCGGCCCG ACTTCCCGGT GCTGGTGCCG 
CGGATGGCCG CGGCCAAGCT CGTCGCGCTC GTCGGGATGG ACCCGCCGGA GCACGACATC 
CAGCGCCGCA TGCTGATCGG CAGCTTCACC GTGCGGCGGG CGAACGCGCT GCGGCCGGAC 
ATCGAACGGA TCGTCGGCGG GCGCGTCGAC GCCCTGCTCG CGCACGAGCC GGGCGAGGTC 
GTCGACCTCG TGCCCGAGTT CGCGTTGCCG ATCCCGTCCA CCGTGATCTG CGAGCTGCTC 
GGCGTGCCCT ACGGCGACCA CGAGTTCTTC GAGGAGCAGA CCCGGCGGAT GGTGATCGCG 
ACCAGCACGG CGGCCGAGGC CGCGGCCGCG TCGCGGGCCC TGGTCGACTA CTTCGACGAG 
CTGATCGCCA GGAAGCGGGA GCGGCCCGGG GAGGGGCTGC TCGACGAGCT GATCGCCGAG 
CGGCTCGTCA CCGGCCAGAT CGGGCAGGAC GATCTCGCGT CGATGGCGAT GTTCCTGCTC 
GTCGCCGGGC ACGAGACGAC CGCGAACATG CTCGGGCTGA GCGTGCTGGC GCTGCTGGAA 
CACCCGGACC AGCGGGCCCG GCTGATCGAG GACCCGGCCG GGCGGGCCGC CGGCGCGACC 
GAGGAGCTGC TGCGCTTCCT GTCGGTGGCC GACGAGATCC AGCGGATCGC CGCCGCCGAC 
ATCGAGGTCG CCGGGGTCGT CATCCGGGCC GGTGACGGGG TGTACCTGCC GACGGCGGCG 
GCGAACCGGA CCGCGGCGAC GTTCCCCGAC CCCGACGCCC TCGACATCGG CCGGGTCCCG 
CGGGGACATC TCGCCTTCGG CTACGGCATC CACCAGTGCA TCGGGCAGAA CCTGGCCCGG 
GTGGAGCTGG AGATCGGCCT GCGCGAGCTG TTCGGCCGCA TCCCGACGCT GCGGCTGGCC 
GAGCCGGTCG AGGCGCTCGG GGCGAAGCCC GGCGGCTCGG TGCAGGGCGT CTACCGGCTG 
CCCGTCGTCT GGTAG

Protein sequence

MSSNQAVVAT PPAFPMDRGC PYHPPAGYAQ LQQDGPITRA TLFDGREVWV VTGYEEARRL 
LVDPRLSSDR SRPDFPVLVP RMAAAKLVAL VGMDPPEHDI QRRMLIGSFT VRRANALRPD 
IERIVGGRVD ALLAHEPGEV VDLVPEFALP IPSTVICELL GVPYGDHEFF EEQTRRMVIA 
TSTAAEAAAA SRALVDYFDE LIARKRERPG EGLLDELIAE RLVTGQIGQD DLASMAMFLL 
VAGHETTANM LGLSVLALLE HPDQRARLIE DPAGRAAGAT EELLRFLSVA DEIQRIAAAD 
IEVAGVVIRA GDGVYLPTAA ANRTAATFPD PDALDIGRVP RGHLAFGYGI HQCIGQNLAR 
VELEIGLREL FGRIPTLRLA EPVEALGAKP GGSVQGVYRL PVVW