Gene Franean1_3938 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3938
Symbol
ID	5672299
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	4706526
End bp	4707779
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	74%
IMG OID	641242817
Product	cytochrome P450
Protein accession	YP_001508234
Protein GI	158315726
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0168475
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCGCCG CCGAGGTCAC CGCAGGGGTC GCCGCCGAGT CCGCCCCGGT GGAGTTCACC 
GCGTTCCATC CGACCCACAA GGCCGATCCG TACGCCGTCT ACCAGCGGGT GCGGGAGGCC 
CGGCCGCTGT GCCCGTTCAT GCTCGGCGAC ATCCCGGTGA CGGTGCTCAC CCGGTACGCC 
GACTGCGAGG CGGTGCTGCA GAGCGACGAC TGGGTGCACG GCTACGACGC CGGCATCAGC 
CCGTTCCGGG ACGGCGCCGC GAGCGCCCCG CGGTCGTTCC TGCGGATGGA CCCGCCGGAC 
CACACCCGGC TGCGCGGGCT GGTCAACAAG GCGTTCACCC CGCGGATCGT CAACCAGATG 
GCGCCGGGCA TCCAGGCCCT CGCCGACCGG CTGGTGGACG GCGCGCTGGC CACCGGGAGC 
ATCGACGTCA TCGGCGAGTA CGCGGCCCTG ATCGCGAGCG CGACGCTCGG CCACCTGCTG 
GGCGTCCCGG ACGACGTCGG CGCGTCGCTG CGCGGCTGGG CGCTGGCCAT CGCCCGCGGC 
ACCGACCCCG ACAACCTGCT CACCGAGGCC GAGCTCGTCG CACGCCGGCA GGCCACCCAG 
GATTTCCAGG CCTACTTCGA GGAGCTGATC GCGCAGCGCC GGGCGAACCC CACCGACGAC 
CTGATCAGCC GGATGGCCGC GGCCCGCGAC CGCGACGACG CGCTCAGCGA GCTCGAGCTG 
CTCGGCGTCT CGTCGCTGCT CGTCGTGGCG GGGATGGAGA CGTCCATCAA CTATGTCGGG 
TCGGCGGTGC TCTCGCTGCT GCGCCACCCC GACCAGCTGG CGCTGCTGCG CGCCCGGCCG 
GAGCTGCTCC CCTCCGCGGT GGAGGAGGTG CTGCGCTACG ACCCGCCGAC GCAGTTCACC 
ATGCGCACCG CGTGCCGCCG GACCGAGCTG GCCGGGCACA CGTTCGCCCG CGGCGACGGC 
GTCCTGCTGG TCAGCGCCGC CGCCGGCCGG GACCCGGCGG CGTTCACCGA CCCCGACCGG 
TTCGACATCA CCCGCTACCA CGGGCCGCGC CCGGCCCGCC GGCACCTGGG CTTCAGCGTC 
GGCATCCACT TCTGCCTGGG CGCCCCGCTC GCCCGGATCG AGGCGGCGGC GGCCATCGGG 
GCCCTCGTCC GGCGCACAAC CACCCTGGAG CTCGCCGTCG ACGAGGCCGA GCTGGTCTAC 
CTGCCCAGCC TCATCCACCG CGCGCTGGCC ACCCTCCCGG TGCGGGTGCG CTGA

Protein sequence

MVAAEVTAGV AAESAPVEFT AFHPTHKADP YAVYQRVREA RPLCPFMLGD IPVTVLTRYA 
DCEAVLQSDD WVHGYDAGIS PFRDGAASAP RSFLRMDPPD HTRLRGLVNK AFTPRIVNQM 
APGIQALADR LVDGALATGS IDVIGEYAAL IASATLGHLL GVPDDVGASL RGWALAIARG 
TDPDNLLTEA ELVARRQATQ DFQAYFEELI AQRRANPTDD LISRMAAARD RDDALSELEL 
LGVSSLLVVA GMETSINYVG SAVLSLLRHP DQLALLRARP ELLPSAVEEV LRYDPPTQFT 
MRTACRRTEL AGHTFARGDG VLLVSAAAGR DPAAFTDPDR FDITRYHGPR PARRHLGFSV 
GIHFCLGAPL ARIEAAAAIG ALVRRTTTLE LAVDEAELVY LPSLIHRALA TLPVRVR