Gene Franean1_1901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1901
Symbol
ID	5670302
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	2281017
End bp	2282252
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	71%
IMG OID	641240822
Product	cytochrome P450
Protein accession	YP_001506244
Protein GI	158313736
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.908058
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGACA CCCGAACCCC GCGGGCCGCC AGCGGGCCGT ACGTCTTCAA TCCGTTCGCC 
GACGGCTTCG CCGAGGACCC CTACCCGCAC TATGCCCAGC TGCGCGAAAA CGCGCCGGCG 
CACCGGCATC CGCTGGGATT CTGGCTTGTC TCCCGGTACG AGGATGTGGC GAGAATCCAG 
CGCTCCGGGC ATTCCGTCGA CGAACGGCAC ATCACCGAGC TTCCGGAGTG GAAAAGCGAG 
TCGCGGACCC TGGGCAAGCA GAACCGGCTC ATGCACGGCC TGTCCATGCT CGACCAGGAT 
CCACCGAACC ACACCAGGCT GCGCCGGCTG GTGACGAAGG CGTTCACCCG GCGCGCCGTC 
GACGCGCTCG AAGGGCGGAT CGAACGCATC GTCGACGACG CTCTCGACCG GATGGCCGAG 
GCGGGCCGGG TCGACCTCGT CGCGGAGCTG GCCTTCCCGC TCCCGTTCAC CGTGATCTCC 
GAGCTGCTGG GCATCCCGGT GCTGGAGCAC GGCAGGCTCC GCGAGCTGAC CGGGACGATG 
GTGCGGGCCC TCGAGCCGCT GCCCGACCCG GGGCTGCAGG CCGAGATCCG GGCGGCGAAC 
GACGAGGTGG CCGCCATCAT GCGCGCGGTG ACCGACTGGA AACGTGACAA CCCCGGCGAC 
GACCTGCTGA CCGCGCTCAT CGGCGCGGAG CACGACGGTG ACGTTCTCAG CGCGGAGGAG 
CTGGTCGCGC AGGTCATGCT GCTGTACGTC GCCGGCCACG AGACGACGGT GAACCTCGTC 
GCGGGCGGGA TCCTCACGCT GCTGCGCCAC CCCGACCAGA TGCGCCGGCT GCGCGACGAG 
CCCGAGCTCG CCGGGAACGC GGTGGAGGAG CTGCTGCGCT ACGACAGCCC GGTGCACCTG 
ATGCGGCGGA TCACCCTGGA GCCGCTGTCC GTGCGTGGCA CGGAGATCCC GCCCGGCGTG 
TTCGTGACGG TGTGTCTCGC GGCGGCCAAC CGGGATCCCG ACTTCTGGGG CCCGGACGCC 
GACGAGGTCC GCCTCGACCG TACCGACGCG CACCGGCACG TGTCCTTCGG CGCCGGGATC 
CACCACTGTG TGGGCGCGGC GCTGGCCCGG TTGGAGGCCC GGGTGGCAAT CTCCCGCTTC 
GTCGGGCGAT TCCCCGCGCC GGCGCTCGAG GACGTCCGCT GGAACGGCCG GATCAACGTC 
CGCGGCCCGG CCTCGCTGAC GGTCGCCGTC CGGTAA

Protein sequence

MTDTRTPRAA SGPYVFNPFA DGFAEDPYPH YAQLRENAPA HRHPLGFWLV SRYEDVARIQ 
RSGHSVDERH ITELPEWKSE SRTLGKQNRL MHGLSMLDQD PPNHTRLRRL VTKAFTRRAV 
DALEGRIERI VDDALDRMAE AGRVDLVAEL AFPLPFTVIS ELLGIPVLEH GRLRELTGTM 
VRALEPLPDP GLQAEIRAAN DEVAAIMRAV TDWKRDNPGD DLLTALIGAE HDGDVLSAEE 
LVAQVMLLYV AGHETTVNLV AGGILTLLRH PDQMRRLRDE PELAGNAVEE LLRYDSPVHL 
MRRITLEPLS VRGTEIPPGV FVTVCLAAAN RDPDFWGPDA DEVRLDRTDA HRHVSFGAGI 
HHCVGAALAR LEARVAISRF VGRFPAPALE DVRWNGRINV RGPASLTVAV R