Gene Francci3_1111 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1111
Symbol
ID	3905453
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1325632
End bp	1326669
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	68%
IMG OID	637878443
Product	cytochrome P450
Protein accession	YP_480220
Protein GI	86739820
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.20408
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.31292
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAGAACG CCCACTCAGA CCTCCGCATG AGCTCGCGTG GCGACCTTCT GCGATCGCCC 
ATCCCGCTGC CGATGGCAGG CGAACGCACC GAGCCGGCGC CGGGCATGTT CACCGCGATG 
GATCCTCCGG AGCACACCCG CTACCGGCGG CATATCGTCG AGTGGTTCTC GACGCGTCGG 
ACCAGGTCCC TGGAGCCGCG GGTGATCGAG ATCGTCGACC AGCACCTGGA CGCGATGATC 
GCCGGTGGCG GTCCGGCCGA CCTGGTGTCG GCGTTCGCCG AACCGGTGTC CGCGCTGGTG 
ATTTGCGAAC TGCTGGGAGT GCCCGTCGAG CAGCGTGAGG TGTTCGGCGC GGCTATCGCA 
GCGTTGTTCA CCGTTCACTC CAGCGCGGAG GAGGCCATCA GCGGCTGGCA GAACATCGGT 
GGACTGCTGA TGGGTCTCAT CCAGGCCAAG CGGGTCGCAT CGGCGGACGA CCTGCTGGGC 
ACGCTGGTGG CCCGGGGTGA GCTCAGCGAC GAGGAGCTGA TGACGATCGG CAGTGTGCTG 
CTGGTCGCCG GGCACGACAC CAGCACCAAC ATGATCGCGA TGGGAACGTT CGCGCTGCTG 
GAACATCCCG AGCAGTATGC GGCGCTGGCC GCGGACCCGG GCCTGGCGCC CGGTGCTGTC 
GAGGAACTGC TTCGCTACCT GACGATCGTG CACGCCGGCT CGATCCGTGC GGTCTCCGCC 
GATCTGGAGT TCGACGGCCA CCAGCTGACC GCGGGTGACG CGGTGTCGCT CTCCCTCGCC 
GCGGCCAATC GGGACCCCGC ACTGTGCGAC GCTCCCGACC GCCTCGACAT CACGCGCGAG 
CCCGTGCCGC ACCTGGCCTT CGGGCACGGC ATCCACCAGT GCGTCGGACA GCAGCTATCC 
CGATTGGAGC TGCGCATCGC GTTCGAATCG TTGGCGCGCC GCCTGCCGAA CCTTCACGTG 
GCGGTGCCGA CCAGCGAGAT CCGTACCCGC TCCGAAATGA TCATCTACGG TGTGCGAGAG 
CTGCCGGTGA CCTGGTGA

Protein sequence

MQNAHSDLRM SSRGDLLRSP IPLPMAGERT EPAPGMFTAM DPPEHTRYRR HIVEWFSTRR 
TRSLEPRVIE IVDQHLDAMI AGGGPADLVS AFAEPVSALV ICELLGVPVE QREVFGAAIA 
ALFTVHSSAE EAISGWQNIG GLLMGLIQAK RVASADDLLG TLVARGELSD EELMTIGSVL 
LVAGHDTSTN MIAMGTFALL EHPEQYAALA ADPGLAPGAV EELLRYLTIV HAGSIRAVSA 
DLEFDGHQLT AGDAVSLSLA AANRDPALCD APDRLDITRE PVPHLAFGHG IHQCVGQQLS 
RLELRIAFES LARRLPNLHV AVPTSEIRTR SEMIIYGVRE LPVTW