Gene Francci3_2664 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2664
Symbol
ID	3904888
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	3144476
End bp	3145801
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	69%
IMG OID	637879989
Product	cytochrome P450
Protein accession	YP_481755
Protein GI	86741355
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.100989
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGTGA GGGGTTCCAG GGGACCGGTG CCGGGCGACG GAGGTCCGCC CCTGGTGGGA 
TACACCCTGC GCTACCTGCA TGACCCTGCC CAGCACTGGC GGCAGCGCTA CGACCGGTAT 
GGCCCGGTGT CATGGGAGCG GACCTTCGGG CTGCGGGTGG TGAGCCTGCT CGGCCCGGAC 
GCCACCGGCT TGGCGCTGCG CAACCATGAG CAGGCATTCG CGAACGGCCC GGGGCAGCAA 
CGGATAGCCG GACCGTTCTT TCGGCGCGGA TTGAGCATGC TCGACTTCGA CGAGCACCGC 
CACCACCGTC GGATCCTCGC CGGCGCGTTC GCCCCGGACA GACTGCGCGG CTATCTCGCC 
GGGATGAACC CGTCCATCGA ACGGGGCGTC GCGGGGTGGC GGCCGGGCGC GAGGTTCCAG 
GTTTATCCCG CGGTCAAACA GCTCACCCTC GAACTGGCGA CCCGGATCTT CATGGGTGAA 
CGGCTGGGAC CGGAAGCCGA CCGGTTCAAC GCCGCGCTGT TCGCCTGCAT CCGCGCGCCG 
GGCGCGGTGG TCCGCGTGCC GGCACCCGGG CTACGTTGGT CGCGTGGCTT GGCCGGGCGC 
CGGTACCTGG AGGAGTTCCT GCGGCTGCGG GTGCCCGCGA AACGAGCCGG GAGCGGCACC 
GACATGTTCA GCCGGCTCTG CCACGCCGAG GCCGAGGACG GCAGCAGGCT GAGCGACGAC 
GACGTCGTCA ACCACATGAT CCTGATGATG GTGGCCGCGC ACGACACGTC CACGATCACG 
ATGACCAGCA TGAGCTACTA TTTGGCACGG CATCCGGAGT GGCAGCAGCG GTGCCGCGAG 
GAGTCGCTCG CCCTCGGCAC GCCAGCGGTG GACCATGCCG ACCTCGATCG GCTGCCGTCA 
CTCGCTCTGG TCATGAAGGA GGCGCTGCGC CTGGTCACGC CGGTGCCGAT CCTCCTGCGC 
GCCACAGTGA AAGACATCGA CGTGCTCGGC GTCACGGTGC CCGCCGGTAC CGTGGCCGCC 
CTCGCGCTCG CCTTCACCCA CCAGATGCCG GAGTACTGGC CGAGCCCGGA ACGGTTCGAC 
CCGGAGCGGT TCGCGGACCA CCGTCGCGAG GACAAGGTAC ATCCCTACGC CTGGCAACCG 
TTCGGTGGCG GGCCACATAC CTGCATCGGT CTGCACTTCG CCGGTCAGCA GGTGAAGGCG 
ATCCTGCACC AGATGCTGCT GCGGTACCGG TGGAGCCTGG CACCGGGCTA CCGGATCTCA 
TTAGACCGTT TCCCGCTGCC TGTTCCACGG GACGGGCTAC CGGTCCAGCT GGAAAAGATC 
ACCTGA

Protein sequence

MAVRGSRGPV PGDGGPPLVG YTLRYLHDPA QHWRQRYDRY GPVSWERTFG LRVVSLLGPD 
ATGLALRNHE QAFANGPGQQ RIAGPFFRRG LSMLDFDEHR HHRRILAGAF APDRLRGYLA 
GMNPSIERGV AGWRPGARFQ VYPAVKQLTL ELATRIFMGE RLGPEADRFN AALFACIRAP 
GAVVRVPAPG LRWSRGLAGR RYLEEFLRLR VPAKRAGSGT DMFSRLCHAE AEDGSRLSDD 
DVVNHMILMM VAAHDTSTIT MTSMSYYLAR HPEWQQRCRE ESLALGTPAV DHADLDRLPS 
LALVMKEALR LVTPVPILLR ATVKDIDVLG VTVPAGTVAA LALAFTHQMP EYWPSPERFD 
PERFADHRRE DKVHPYAWQP FGGGPHTCIG LHFAGQQVKA ILHQMLLRYR WSLAPGYRIS 
LDRFPLPVPR DGLPVQLEKI T