Gene Franean1_3863 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3863
Symbol
ID	5672226
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	4590957
End bp	4592183
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	69%
IMG OID	641242741
Product	cytochrome P450
Protein accession	YP_001508161
Protein GI	158315653
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.793072
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACGG TGACGACGGA GACCAGCGAC GCCGCCGGCG ACGTCTACTA CGACCCGTAC 
GACTTCGAGA TCGACGCCGA CCCGTACCCG GTGTGGCGGC GGATGCGGGA CTCCGTGCCG 
CTGTACTACA ACGCCAAGTA CGACTTCTTC GCCATCAGCC GGTTCGACGA CGTCGAGAAG 
GTCATGGGCG ACTTCGAGAC CTACCGGTCG GGCCGCGGCT CCGTCCTCGA GATCATCAGG 
TCGAACATCG ACTTCCCGCC GGGGAACATC CTGTTCGAAG ACCCGCCCGT GCACGACATC 
CACCGCAGCA TCCTCGCCCG GGTCTTCACC CCGCGGAAGA TGCTCGCGAT CGAGCCGAAG 
GTGCGCGAGT TCTGCGCCCG CTCGCTCGAC TCGCTGGTGG CCGAGGGCAA CTTCGACTTC 
ATCGCCGACC TCGGCGCCCA GATGCCCATG CGGACGATCG GCATGCTGCT CGGCATCCCC 
GAGCAGGACC AGGAGGCGAT CCGCGACGCC GTCGACGAGG GCCTCACCCT CACGGAGGGC 
GCGCCGAAGC CGCTGAACGA GGACCCCCTC GCGCGCTCGG AGGGCATGTT CGCCGACTAC 
CTCGACTGGC GGGCACGCAA CCCCTCGGAC GACCTCATGA CCGAGCTGAT CACCGCCGAG 
TTCGAGGACG AGACGGGCAC GACCCGCCGG CTGACCCGCG CTGAGGTCCT CACCTACGTG 
AACATGCTGT CGAGCGCCGG CAACGAGACC ACCACCCGGC TGATCGGCTG GACCGGGAAG 
GTCCTCTCCG ACCACCCCGA CCAGCTCCGG CAGGTCGCAC GGGACAGGTC GATGGTCAAC 
CAGGTGATCG AGGAGGTGCT GCGCTTCGAG GCGCCCTCCC CCGTCCAGGC CCGCTACGTC 
GCCAGGGACG TCGAGGTGCA CGGCCAGACG GTGCCGGAGG GCAGCGTCAT GGTGCTGCTC 
AACGGCTCGG CCAACCGCGA CGAGCGCCAG TTCGTCAACG GCGACAGCTT CGACATCCAC 
CGGTCGATCA GCCGTCATGT CAGCTTCGGC CGCGGGCTGC ACTTCTGCCT GGGCGCCGCG 
CTGGCCCGCC TCGAGGGACG GGTGGCGCTG GACGAGGTGC TCAAGCGCTG GGACCGCTGG 
GAGGTCGACT ACGATCGCGC CGTCCAGGCC CGCACCTCCA CCGTCCGCGG CTGGGCCAAG 
CTCCCGGTCA CGGCGACGCC GAGGTGA

Protein sequence

MTTVTTETSD AAGDVYYDPY DFEIDADPYP VWRRMRDSVP LYYNAKYDFF AISRFDDVEK 
VMGDFETYRS GRGSVLEIIR SNIDFPPGNI LFEDPPVHDI HRSILARVFT PRKMLAIEPK 
VREFCARSLD SLVAEGNFDF IADLGAQMPM RTIGMLLGIP EQDQEAIRDA VDEGLTLTEG 
APKPLNEDPL ARSEGMFADY LDWRARNPSD DLMTELITAE FEDETGTTRR LTRAEVLTYV 
NMLSSAGNET TTRLIGWTGK VLSDHPDQLR QVARDRSMVN QVIEEVLRFE APSPVQARYV 
ARDVEVHGQT VPEGSVMVLL NGSANRDERQ FVNGDSFDIH RSISRHVSFG RGLHFCLGAA 
LARLEGRVAL DEVLKRWDRW EVDYDRAVQA RTSTVRGWAK LPVTATPR