Gene Franean1_1428 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1428
Symbol
ID	5669833
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	1723883
End bp	1725100
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	69%
IMG OID	641240349
Product	cytochrome P450
Protein accession	YP_001505776
Protein GI	158313268
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCGCTG CGCCGCAGGT TGTATTCGAT GCCTTTGCTC CTGTGTACCG ATCCAACCCC 
TACCCGCGAT ACGCGTTGGT TCGCGAATCC ACCGCCCTAT ACCCGATCAA TCCGCAGATC 
GCCATGGCAA CGCGCTACGA GGAGTGCTCG GCGGTTCTCA CGGACGCGCT CTGGGGCCAT 
GGCTACGAGG ACGGCATCAA CCCCTTCCGC CCCGGGGTGG ATCCCGACGA CGTCCCGGGC 
TCGATGCTGC GGATGGACCC GCCGGACCAC ACCCGGATGC GGGGGCTGGT CAAGCGGGCG 
TTCGTCCCGC GCCACACCGA AGGGCTCCGA CCACGGGTCG AAGGTCTCGT CAACGAACTG 
ATCGACACCG CGATCGAGGC CGGCGAGGTT GACCTGATGG AGGCCCTGGC CCGGCCGTTG 
CCACTCACCG TCATCGGGGA CATGCTCGGC ATCCCGCCGG AGGACTACAC CGCGGTCAAG 
AAGTGGTCGC TGGAGATCGT CCGTGGCACG GACCCGGACA TCCTGCAGTC ACCCGAGAGC 
CTGGCGCGTC GGCCTGAGGC GATGCGGGAG TTCGAGGCGT ACTTCGCCGG GCTGATCGCG 
CAGCGGCGCA AGGACCCTCG CGACGACCTG CTGAGCGATC TCTGCGCGGC GCAGGAACGC 
GACTCCGTGC TGAGCGACCG CGAGATGCTC GGGCTCTCCG TAGGGCTGCT GATCGGAGGC 
TACGAGACCG TCTCCGACCT GATCGGCAAG GGCCTGGTGG CCTTGTTGCG CAACCCCGAC 
CAGGTCGCCC TGTGGCGGTC CAACCCGGAA CTCGCCCCGT ACGCGGTCGA CGAGCTTCTC 
CGCTACGAGC CGCCGGTGCA GTTCACCCAT CGGGTCGCGC TGGAGGAGCG GGAGCTCGCC 
GGGCGCGCTT TCGCCCGGGG CGAAGGTGTC GTCGTCCTGA TCGCCGCCGC CAACCGCGAC 
CCGGCCGTGT ACAGCGATCC TGAGCGCCTG GACATCACCC GGTTCGCCGG GCGTTCCCCC 
GCGCCCCGCC ACCTCTCGCT CAGCGAGGGC ATCCACTACT GCCTCGGCGC TCATCTCGGG 
CGGCTGCAGA CACAGATCGC GGTGGACACT CTCCTGCTCC GTGCGCCGGG GCTGTCGCTG 
ACCGACGACG AACCCGTGTG GCGCGACACA GTCGCCATCC ACGGGCTGGA CACCCTCCCA 
ATCCGCCTGC GGGACTGA

Protein sequence

MSAAPQVVFD AFAPVYRSNP YPRYALVRES TALYPINPQI AMATRYEECS AVLTDALWGH 
GYEDGINPFR PGVDPDDVPG SMLRMDPPDH TRMRGLVKRA FVPRHTEGLR PRVEGLVNEL 
IDTAIEAGEV DLMEALARPL PLTVIGDMLG IPPEDYTAVK KWSLEIVRGT DPDILQSPES 
LARRPEAMRE FEAYFAGLIA QRRKDPRDDL LSDLCAAQER DSVLSDREML GLSVGLLIGG 
YETVSDLIGK GLVALLRNPD QVALWRSNPE LAPYAVDELL RYEPPVQFTH RVALEERELA 
GRAFARGEGV VVLIAAANRD PAVYSDPERL DITRFAGRSP APRHLSLSEG IHYCLGAHLG 
RLQTQIAVDT LLLRAPGLSL TDDEPVWRDT VAIHGLDTLP IRLRD