Gene Franean1_3937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3937
Symbol
ID	5672298
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	4705083
End bp	4706375
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	70%
IMG OID	641242816
Product	cytochrome P450
Protein accession	YP_001508233
Protein GI	158315725
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.00640549
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGAGTGAGC TCGAGACCAA GGACTTCTTC CGGGACGAGG AGCTCGTCGC GGACCCGTAC 
CCGTTCCTCG AGGCGATGCG CGGGAAGTGC CCCGTGCAGC GCGAGAATCA CCACGACGTG 
GTGATGGTGA CGGGGTACGA CGAGGCGGTC CAGGTCTTCC ACGACTCGGC GACCTTCTCC 
TCGTGCGTCT CGGTGACGGG TCCGTTCCCG GGTTTCCCCG TCCCGCTCGA GGGCGACGAC 
GTCACCGAGC TGATCGAGCG GCACCGCGGT GAGCTGCCGA TGAACGACCA GCTCCCCACG 
CTCGACCCGC CCACGCACAC CGCGCACCGC GCGCTGCTGA TGCGGCTGAT CACGCCGAAG 
CGCCTCAAGG AGAACGAGGC GCAGATGTGG CGGCTCGTCG ACCAGATGGT CGAGCCGTAC 
CTGGCCGGCG GCGAGGGCGA GTTCATCACC GGCTTCGCCG GGCCGTTCAC CCTGCTGGTG 
ATCGCCGACC TGCTGGGCGT GCCCGAGGAG GACCAGGAGG AGTTCCTCGA CCGCCTCCAG 
CGCCAGCCGC AGGAGAGCGG CGGCATCGGC AGCACCGGCG ACGACCACAT GGCGCACAAC 
CCGCTGGAGT TCCTCTACAA CAAGTTCACC GCCTACATCG AGGACCGCCG GCGCGAGCCC 
CGCGAGGACG TCCTCACCGG GCTGGCGCTG GCGACGTTCC CCGACGGGTC GACCCCGGAG 
GTCATCGACG CCGTCCGGGT CGCGGCCAAC CTGTTCTCCG CCGGACAGGA GACCACCGTC 
CGGCTACTCT CCTCGGCACT GAAGATCCTC GCCGAGGACC GCGAGCTCCA GCAGCTGCTA 
CGGGCCGAGC CGGACCGCGT CGGCAACTTC ATCGAGGAGA CGCTGCGGCT GGAGAGCCCG 
GTCAAGGGCG ACTTCCGGCT CTCCCGGGTG CCGACCACCG TCGGCGGCGT CGACCTGCCC 
GCCGGCACCA CGGTCATGGT CGTCAACGGC GCCGCGAACC GCGACCCGCG CCGCTTCGAG 
AACCCGAGCG TGTTCGACGT CGCCCGCCCG AACGCCCGCC ACCACGTGGC GTTCGGCCGT 
GGCATCCACA CCTGCCCCGG CGCCCCGCTC GCCCGCGCCG AGGCGCGTGC GAGCATCGAG 
CGGCTGCTCG AGCGCACCAC CGACATCCGG ATCTCCGAAA GCGTGCACGG CCCCGCGGAC 
GACCGCCGGT ACAGCTACCT GCCCACCTTC ATCCTGCGTG GGCTGACGCA CCTCAACCTC 
GAGTTCACCC TCGCAGAGAG CAAGACGCCA TGA

Protein sequence

MSELETKDFF RDEELVADPY PFLEAMRGKC PVQRENHHDV VMVTGYDEAV QVFHDSATFS 
SCVSVTGPFP GFPVPLEGDD VTELIERHRG ELPMNDQLPT LDPPTHTAHR ALLMRLITPK 
RLKENEAQMW RLVDQMVEPY LAGGEGEFIT GFAGPFTLLV IADLLGVPEE DQEEFLDRLQ 
RQPQESGGIG STGDDHMAHN PLEFLYNKFT AYIEDRRREP REDVLTGLAL ATFPDGSTPE 
VIDAVRVAAN LFSAGQETTV RLLSSALKIL AEDRELQQLL RAEPDRVGNF IEETLRLESP 
VKGDFRLSRV PTTVGGVDLP AGTTVMVVNG AANRDPRRFE NPSVFDVARP NARHHVAFGR 
GIHTCPGAPL ARAEARASIE RLLERTTDIR ISESVHGPAD DRRYSYLPTF ILRGLTHLNL 
EFTLAESKTP