Gene Franean1_4491 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4491
Symbol
ID	5672841
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5357824
End bp	5359089
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	67%
IMG OID	641243358
Product	cytochrome P450
Protein accession	YP_001508774
Protein GI	158316266
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGTTG ACGACACCGA GGCGTCCGCG CCCACGACCC AGCGCGGGTA CGCCACGGCC 
CCCACGCTCG CGGGGTTCTC GCACGCGGCG AACGAGCGTC TCAATGCCGA CCCGTGGGGC 
GAGCTCGACC GGCTCCGCGA CGAGTCGCCG ACATTCCGTA GCGACATGCC GAATCCTCTC 
GTCCCCGGCG CGTCGCTGTG GTATCTCCTC GACTACGAGA GCGTCTACAC CGCGCTGCGT 
GACTGGGAGA CCTTCTCCAA CGTGGGATCG GCGCACCCGT TCTCCGACAG CGACCCGTAC 
AGCATGATCC CCGGCGAGCT GGACCCGCCG GACCACACCA AGTTCCGGCG GCCGCTGAAC 
GCCCACTTCT CGCCCGGCGC GATCCGCGCG CTCGAGCCGG ATATCCGCCG GACGGCCGTT 
GAGCTCATCG AGTCGTTCAA GGATTCCGGC CAGTGCGACT TCGTCACCGA CTTCGCGCTG 
CACTTTCCTA CCCGGGTCTT CGAGCGGATG TTCGGCGTCC CGCTCGAGGA TCACGACCAG 
CTCACCGCGT GGGTGCATAC CTTCGGCCAG CAGATGGCGA CACAGACCGC GATCGACAAG 
GCCGTCGCCG CCGAGCAGGA GGTGCTGGCC TACCTGGGGA AGAAGCTGGA CGAGCGCGAG 
CAGTCCCCCA GGGAGGACCT GCTCGGCGCG ATCGCCTTCA TGGAAGTCGA CGGCGCCCGG 
ATCAGTCGCA AGGAGCAGGT GGCGGTCGCC TACCTGATGT TCCAGGCGGG TATGGACACG 
GTGGCGAGCC AGCTGGGCTG GTCCTTCCGC CACCTCGCCG AGAACGAGGT CGACCGGCAG 
GCGATCCTCG CCGACCCGAA GCTGATTCCC TCGACGGTGG AGGAGCTCCT GCGCTCCTAC 
GACATCCTCT CGCACACCAT GATCGTCGCC AAGGATGTCG AGTTCAACGG CTGCCCGATG 
AAGAAAGGCG ACCGGGTGGT CACCATGATC TCGGCGGCGA ACCGGGACCC GAACGAGTTC 
CCGGACCCGG ACACCTTCGA CGTCTCCCGC AAGCCGAACC GGCACATGGC CTTCGGGGTG 
GGGCCGCACC GCTGCATCGG TGCGCACCTG GCCCGGATCG AGCTGAACAT CGCGCTGGAG 
GAGTGGCACC AGCGGATCCC GAATTACAAG GTGGCCGAGG GCGCCGAGTT CGGCCAGTCC 
ATGAAATGGG CGGTCACCTC GATGGAATCG CTCCCGCTCG AATGGGATGT CGAGGCGGTG 
AACTGA

Protein sequence

MSVDDTEASA PTTQRGYATA PTLAGFSHAA NERLNADPWG ELDRLRDESP TFRSDMPNPL 
VPGASLWYLL DYESVYTALR DWETFSNVGS AHPFSDSDPY SMIPGELDPP DHTKFRRPLN 
AHFSPGAIRA LEPDIRRTAV ELIESFKDSG QCDFVTDFAL HFPTRVFERM FGVPLEDHDQ 
LTAWVHTFGQ QMATQTAIDK AVAAEQEVLA YLGKKLDERE QSPREDLLGA IAFMEVDGAR 
ISRKEQVAVA YLMFQAGMDT VASQLGWSFR HLAENEVDRQ AILADPKLIP STVEELLRSY 
DILSHTMIVA KDVEFNGCPM KKGDRVVTMI SAANRDPNEF PDPDTFDVSR KPNRHMAFGV 
GPHRCIGAHL ARIELNIALE EWHQRIPNYK VAEGAEFGQS MKWAVTSMES LPLEWDVEAV 
N