Gene Franean1_2913 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2913
Symbol
ID	5671300
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	3429840
End bp	3431030
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	62%
IMG OID	641241820
Product	cytochrome P450
Protein accession	YP_001507240
Protein GI	158314732
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCGCTAC TGAGGAGCAA GGACATCTAC TACGACCCGT ACGATGCCCA AATCGACTCC 
GATCCGTATC CGGTGTGGCG TTCGATGCGG AACGAGGAGC CGCTCTACTA CAATGAGAAA 
TACGATTTTT ACGCTTTGAG TCGCTACGGT GACGTCGATG CATGCCTGTC CGACCGGGCT 
ACCTACCGCT CCGGCCGCGG TTCTATCTTA GAGATAATAA AAGCGAATAT CGAGTTTCCG 
CCGGGAATGA TCCTGTTCGA GGATCCGCCA ATACACGATG TTCATCGTGG CATCCTTGCC 
CGAATTTTCA CGCCGAAGAA GATGAACGCA CTCGAGTCGA AGGTTCGAGA GTTCTGCGTG 
CGCAGCCTCG ATCCTCTGGT CGGCTCCGGT CGGTTCGACT TCGTCGAGGA TCTGGGAGCG 
CAGATGCCGA TGCGTACGAT CGGTTTCCTG CTCGGTATAC CCGAAAAGGA CCAGGAAGCG 
ATCCGGGACC ATAGTAACGC TGGCCAGCGC CTCGATGAGG GTCAGGAGCC GACCGTACGC 
GAGCCGAACG GTGAACATTT CGAAGCGTAT ATCGACTGGC GGGCCGAGCA CCCCTCCGAT 
GATCTCATGA CCGAGCTCCT GCACGCCGAG TTCGACGACG AGACCGGAAC GAGGCGCCGG 
CTGAGCCGCA GCGAGGTGCT CCTCTACATC CAGATGCTGG CAGGCGCCGG CAACGAGACG 
ACGACGAGGC TGATCGGCTG GACCGGAAAA GTACTGGGAG AACACCCGGA CCAGCGGCGC 
GAGATCGCAG CGGACCGGTC ACTGATCCCC CAGGCGATCG AGGAGCTGCT CCGCTATGAG 
GCGCCCTCGC CGGTGCAGGC ACGCTACGTA GCCCGCGACG TTGAGCACTA CGGTCGGACC 
ATCCCAGAAA ACAGTGCCAT CCTCCTGCTG AACGGTTCGG CCAACCGCGA CGAACGCCAG 
TTTCCCGACG GCGACAGGTT CGACATCCAT AGGCGTCGCA GCCGTCACCT CAGTTTCGGC 
TACGGCATCC ACTTCTGCCT CGGGGCCGCC CTGGCCCGCC TCGAGGGCCG GGTAGCGCTC 
GACGAGGTCC TCAAGCGGTT CCCGGACTGG GAGATCGACC GGGACAGCGC CATCCAAGCC 
CGCACCTCGA CGGTGCGCGG CTGGCAGTCC CTCCCCGTCT TCGTCCCGTA G

Protein sequence

MSLLRSKDIY YDPYDAQIDS DPYPVWRSMR NEEPLYYNEK YDFYALSRYG DVDACLSDRA 
TYRSGRGSIL EIIKANIEFP PGMILFEDPP IHDVHRGILA RIFTPKKMNA LESKVREFCV 
RSLDPLVGSG RFDFVEDLGA QMPMRTIGFL LGIPEKDQEA IRDHSNAGQR LDEGQEPTVR 
EPNGEHFEAY IDWRAEHPSD DLMTELLHAE FDDETGTRRR LSRSEVLLYI QMLAGAGNET 
TTRLIGWTGK VLGEHPDQRR EIAADRSLIP QAIEELLRYE APSPVQARYV ARDVEHYGRT 
IPENSAILLL NGSANRDERQ FPDGDRFDIH RRRSRHLSFG YGIHFCLGAA LARLEGRVAL 
DEVLKRFPDW EIDRDSAIQA RTSTVRGWQS LPVFVP