Gene Franean1_4689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4689
Symbol
ID	5673031
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5603347
End bp	5604681
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	68%
IMG OID	641243546
Product	cytochrome P450
Protein accession	YP_001508962
Protein GI	158316454
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.110488
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGCGAAT TCGAGGCAAT GGACTTCTTC CGCGACGAGA CTCTCGTCGC GGACCCGTAC 
CCTTACCTCG ACGCCCTGCG GCGGAAATGC CCCGTACAAC GGGAACGCCA CCACGACGTG 
GTGATGGTGA CCGGCTACGA GGAGGCGGTG GAGGTCTTCC ACGACTCCGA GGCGTTCTCG 
TCCTGCGTCT CGGTGACAGG CCCGTTCCCC GGCTTCCCGG TCCCGCTCGA CGGTGACGAC 
GTCTCCGCGC TGATCGAACG GCATCGCCAT GAGCTGCCGA TGAACGACCA GCTCCCGACG 
ATGGACCCGC CCACCCACAC CGATCATCGC GCGCTGCTGA TGCGGCTGAT CACCCCTAAG 
CGCCTCAAGG AGAACGAGGC GCTGATGTGG GACCTTGCCG ACCGCATGCT CGACCCGTTC 
CTCACTCCTG GTGAGGGAGA GTTCATCAGC GGATTCGCCG GACCGTTCAC ACTGCTCGTC 
ATCGCGGACC TTCTGGGCGT CCCCGAGGAG GACCAGGACG AGTTTCTCGA CAAACTGCAG 
CGCCAGCCGG CACAGACCGG CGGCGTCGGC GGCACCGGAG CGGAGACCCT GGCCCACAGC 
CCGCTGGAGT TTCTCTACGG GAAGTTCACC GGCTACATCG AGGACCGTCG CCGCAACCCC 
CGCGCCGACG TGCTGACCGG TCTGGCCGGC GCGACGTTCC CGGACGGATC GACACCCGAG 
GTTATCGACG TGGTGCGGGT GGCCGCGAAC CTCTTCTCCG CCGGTCAGGA AACCACGGTG 
CGCCTGCTCA GCTCGGCGCT GAAGATCCTC GCCGAGCGGC CCGACCTCCA GCGGCAGCTT 
CGTGTCGAGC GGGAGCGCAT CCCGGCCTTC ATCGAGGAGA CCCTGCGCTG GGAGAGCCCG 
GTCAAGGGCG ACTTCCGGCT CTCCCGTGTG CCGGTCACCG TGGGTGGGGT GCAGCTGCCC 
GCCGGCACCA CGGTGATGGT GGTCAACGGG GCGGCCAACC GCGACCCACG CCGCTTCGAG 
AACCCGGAGA CGTTCGACGT CGCCCGTTCC AACGCCCGCC AGCACCTGGC CTTCGGGCGT 
GGGATCCACA GCTGCCCCGG CGCGCCGTTG GCACGGGCCG AGGCACGGGC GAGTCTTGAA 
CGGCTGTTGG ACCGCACCAC CGACATCCGC GTCAACGAGC GGGTGCACGG CCCGGCCGGC 
AACCGCCGCT ACGAGTACAT GCCCACCTTC ATCCTGCGTG GGCTGACCGC CCTGCACCTG 
GAGTTCGACC TCGCGCCAGC ACCGCCACGT GACTTCCCGC CCGCCGGCTC ACCTGTCGGA 
TGGATCAAGG GCTGA

Protein sequence

MREFEAMDFF RDETLVADPY PYLDALRRKC PVQRERHHDV VMVTGYEEAV EVFHDSEAFS 
SCVSVTGPFP GFPVPLDGDD VSALIERHRH ELPMNDQLPT MDPPTHTDHR ALLMRLITPK 
RLKENEALMW DLADRMLDPF LTPGEGEFIS GFAGPFTLLV IADLLGVPEE DQDEFLDKLQ 
RQPAQTGGVG GTGAETLAHS PLEFLYGKFT GYIEDRRRNP RADVLTGLAG ATFPDGSTPE 
VIDVVRVAAN LFSAGQETTV RLLSSALKIL AERPDLQRQL RVERERIPAF IEETLRWESP 
VKGDFRLSRV PVTVGGVQLP AGTTVMVVNG AANRDPRRFE NPETFDVARS NARQHLAFGR 
GIHSCPGAPL ARAEARASLE RLLDRTTDIR VNERVHGPAG NRRYEYMPTF ILRGLTALHL 
EFDLAPAPPR DFPPAGSPVG WIKG