Gene Franean1_4029 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4029
Symbol
ID	5672387
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	4804105
End bp	4805301
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	67%
IMG OID	641242905
Product	cytochrome P450
Protein accession	YP_001508322
Protein GI	158315814
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.717223
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGTTAA CCAGCCCCAG CGACGTCTAC TACGATCCTT ACGACGCCCA GATCGACGCC 
GACCCCTACC CGGTCTGGCG GCGCATGCGC GACGAGGCAT CGCTCTACTA CAACGAGAAG 
TACGACTTCT ACGCCCTCAG CCGCTTCGAG GACGTCGAGC CCTGCCTGAG TGACTGGAAC 
ACCTACCGGT CCGGCCGGGG ATCCATCCTG GAGCTCATCA AGGCCAACAT CGAGCTGCCC 
TCGGGAATCA TTCTCTTCGA GGACCCGCCG ATCCACGACA TTCACCGCAG CCTGCTCGCC 
CGGGTCTTCA CCCCGCGGAA GATGAACGCG CTGGAGCCGA AAATCCGCGA GTTCTGCGCG 
CGTTCCCTCG ATCCCCTTGT CGGGACCGAG CGCTTCGATT TCATCCGGGA CCTCGGCGCG 
CAGATGCCGA TGCGCACGAT CGGCTTTCTC CTGGGAATCC CGGAATCCGA CCAGGAGGCG 
ATCCGGGACC GTCTCGACGA GGGCCTGCAG CTGCGCGAGG GTGAAGAGCT CTCGGTCTCG 
GCGGAGGACT TCAACGCCGA CGAGTTCGGC GCCTACATCG ACTGGCGGGC CGAGCATCCC 
TCCGACGACC TGATGACGGA GCTCCTGAAC GCCGAGTTCG AGGACGAGAC GGGCACCGTC 
CGCAAGCTCC ACCGAGAGGA AGTGCTCACT TACGTCACGA TGCTCGCCGG GGCCGGGAAC 
GAGACGACCA CGCGACTCAT CGGCTGGACC GGAAAGATTC TCGCCGAGAA CCCCGACCAG 
CGGCGCGAAC TCGTCGCGGA CCGCTCGCTC ATTCCGAACG CGATCGAGGA GCTGCTGCGT 
TTCGAGGCGC CCTCACCGGT GCAGGCGCGC TATGTCGCCC GCGACGTCGA ACACCACGGC 
CACACCGTGC CCGAGGGCAG CATCATGGTG CTGCTGAACG GCTCGGCGAA CCGGGACGAG 
CGCCGCTTCG CCGACCCTGA CCGCTTCGAC GTCCACCGCG ACGTCGGCCG CCATCTCAGC 
TTCGGCTATG GCATCCACCA CTGCCTCGGG GCGGCGCTGG CCCGACTCGA GGGCAGGGTC 
GCCCTGGACG AGGTCCTCAG CCGGTTCCCG ACCTGGGAGA TCGACTGGGA CAACGCCGTC 
CAGGCCCGCA CCTCGACGGT CCGCGGCTGG GAGACGATGC CCGCCTTCGT CCGGTAG

Protein sequence

MPLTSPSDVY YDPYDAQIDA DPYPVWRRMR DEASLYYNEK YDFYALSRFE DVEPCLSDWN 
TYRSGRGSIL ELIKANIELP SGIILFEDPP IHDIHRSLLA RVFTPRKMNA LEPKIREFCA 
RSLDPLVGTE RFDFIRDLGA QMPMRTIGFL LGIPESDQEA IRDRLDEGLQ LREGEELSVS 
AEDFNADEFG AYIDWRAEHP SDDLMTELLN AEFEDETGTV RKLHREEVLT YVTMLAGAGN 
ETTTRLIGWT GKILAENPDQ RRELVADRSL IPNAIEELLR FEAPSPVQAR YVARDVEHHG 
HTVPEGSIMV LLNGSANRDE RRFADPDRFD VHRDVGRHLS FGYGIHHCLG AALARLEGRV 
ALDEVLSRFP TWEIDWDNAV QARTSTVRGW ETMPAFVR