Gene Franean1_4706 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4706
Symbol
ID	5673048
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5621524
End bp	5622741
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	65%
IMG OID	641243563
Product	cytochrome P450
Protein accession	YP_001508979
Protein GI	158316471
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.15095
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.897652
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGAAAC CAGTACAACC TGCTGACAGG ATCGTCGGCG ACGTGGACGA CGACGTCGAC 
TACGTCGACG GCCAAATCAC GGACTTCCAC GCACGCTTAG CCGCGCTTCG TGCCGAGAAG 
GGCGTCGCCC GCCTTCGGTT CGGCCCCGAC ACCGGCCTCA TGCTGCTCCG CCACGCCGAT 
GTGGTCGTCG CTCTACGAGA TGAGACCCGC TTCTCGAAAT CCGGGGCGTT CCGGCCGATC 
ACGTTCCCGT TCCTAGGCCC CAATATCACC GGCTATGACG GTCACGAACA CAATGTGAAG 
CGTGCCCTGG TGTCGCCGAC GTTCCGCCGG ACAATGATCC CGCGTTACAT CCAACCCGTC 
ATCCGGCCGA TCGCTGAGGA GCTCGTCGCC GACCTCGCAA CACTCGGCGA GGCCGACCTC 
ATGGCCACGT TCGCCAAGAA GTACCCTATG CGGATCACCA GCCGCCTCCT CGGTATCCCG 
TCCGACGAGG AGGACAAGCT GGCGAGCTGG GCCTTCTCCA TGCTCCATAT CGCAGGCGAC 
CCCGACGGCG CCATGAAGGC CAATGCAGAG TTCACCGAGT ACGTCGGACC GCTTATCGAC 
ACCCGGCGCG CCCACCCCCG TGACGATCTT CTTTCGGCGC TGCTGACCGA GGAGGTCGAA 
GGCCAACACC TCGACCACGA CGAGGTTCTC GGCTTCCTTC GCCTGCTGTT CCCTGCCGGC 
GTCGACACGA CCTGGCAGGC GCTCGGCAGT CTCGTGCACG CGGTCCTCGA GCATCCCGAG 
GTCCACCAGA GGCTCCGCCG CGACGAGGAG GAAAGGGCCT GGGCAGTCGA GGAAACGCTC 
CGCTGGGAGT CACCCGTAGC AGCTGATTCG CGGCTGACCC TGCAAGACGT CGTCGTCTCA 
GGCGTCGAGA TCGCCGCCGG AGAACTTGTG CGACTTGGCC TATCCGTGGC CAACCGAGAC 
CCCGACGTCT TCCCGGACCC CGATCGCTGG AACCTGGACC GCAGACCGAC AAACCACATC 
ACGTTCGGGC TCGGCCGCCA CTTCTGCCTC GGCGCCCACC TGGCGCGCGT CGAACTGCAG 
GTGGCACTCG ACGTGCTGCT GCAGCGGTTG CCCAACCTCC GACTTCTCGA GCAACCCCAA 
ATCACCGGCA TAGGCATCCG CGGCCCCAAG ACCCTCCGAG TCGCGTGGGA CGCGCCCTCC 
ACACCTGGTG CACCCTGA

Protein sequence

MLKPVQPADR IVGDVDDDVD YVDGQITDFH ARLAALRAEK GVARLRFGPD TGLMLLRHAD 
VVVALRDETR FSKSGAFRPI TFPFLGPNIT GYDGHEHNVK RALVSPTFRR TMIPRYIQPV 
IRPIAEELVA DLATLGEADL MATFAKKYPM RITSRLLGIP SDEEDKLASW AFSMLHIAGD 
PDGAMKANAE FTEYVGPLID TRRAHPRDDL LSALLTEEVE GQHLDHDEVL GFLRLLFPAG 
VDTTWQALGS LVHAVLEHPE VHQRLRRDEE ERAWAVEETL RWESPVAADS RLTLQDVVVS 
GVEIAAGELV RLGLSVANRD PDVFPDPDRW NLDRRPTNHI TFGLGRHFCL GAHLARVELQ 
VALDVLLQRL PNLRLLEQPQ ITGIGIRGPK TLRVAWDAPS TPGAP