Gene Franean1_6845 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6845
Symbol
ID	5675158
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	8344610
End bp	8345806
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	69%
IMG OID	641245694
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_001511085
Protein GI	158318577
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACAGAG AGGCTTTTGA CCACGAGCTG GTGCGCCGGC TGATCGAGCA CGTCGAGAAC 
CGGACCACCG ACCAGGCCGA GTCGGTCCTC GAGGTGTCCA CGGACATCTA CTCGGCCGAG 
CACTACCGCG AGGAGGTCGA GGCGCTCTTC CTCGACCAGC CGCTCGTGCT GGGCCTTTCG 
GGCGCTCTCG TCGGGCCGGA CTCCTACCGG ACGGTCGACA TCCTCGGGAC GCCGATCCTG 
CTGACCAGGG ACGCCAAGGG CCAGGTCCGG GCGCTGACGA ACGTCTGCCG CCACCGCGGC 
GTGCGGCTCG TCGACGGCGC GGGCAAGGCC GCGCGGTTCA GCTGTCCGTT CCACTCGTGG 
AGCTACGACA ACGAGGGCAG GCTGGTCGGG GTGCCCTCGG CGGAGTACTT CGAGGGGATG 
TGCCTGGAGG ACAAGGGCCT TGTCGAGCTC CCGGTCGCCG AGGGCTACGG GCTCATCGTC 
GGGCGGCTGC GCCCCGGCCA GCCGCTCGAC ATCGACGACT ACCTCGGCCC GGAGCTCGCG 
GGCGAGCTCG AGATGCTGGA CTTCGCCAAC TGGGAGCAGC ACAGCGAGCC GCACCCGCAC 
GAGGTCGCCG CGAACTGGAA GGTCACCCTC GACACCTTCC GGGAGAACTA CCACTTCAAC 
TATCTGCACC GGAAGACGCT GCGCACCTAC GCCTACGGCG GGGTGCTGAC CTTCGACCCG 
CTCGGGCGGC ACCTGCGCAA CGCCTCGGCG CTGCGTTCCA TCGACGCGCT GCGGGACACC 
CCGGAGAGCG AGTGGGGCGA CGTCACACAG CACTTCAGCC CGCAGTACTC GCTGTTCCCC 
AACACCTGCC TGACTTTCGA CAGCCGGCAC GTCGAACTGT GGCAGATCCT GCCCGTCGAC 
AGCACCACGT CGCGGGTCCT GCACTCGGTC TACCTGCGTC CCGGGCTGTC CCCCGAGGAG 
CGGGCCAAGG CCGTCGACAT GGCGCCGTGG ATCTGCGAGA CGGTGGTGGA CGGTGAGGAC 
TTCTGGGTCG CCGGCCGCAC GGAGCCCGGC ATCCGGGCCG GGATCGTCGA CACGGTGGTG 
TTCGGGCGTA ACGAGCCGGC TCCGCAGCAC CTGCACCACG GTTTCACCGA GACGATCCAG 
GCGTACCGGG AGCGCAAGGC CGCGCAGGCC GGCGAGTCCG CCCCGGCTGG GAAGTGA

Protein sequence

MDREAFDHEL VRRLIEHVEN RTTDQAESVL EVSTDIYSAE HYREEVEALF LDQPLVLGLS 
GALVGPDSYR TVDILGTPIL LTRDAKGQVR ALTNVCRHRG VRLVDGAGKA ARFSCPFHSW 
SYDNEGRLVG VPSAEYFEGM CLEDKGLVEL PVAEGYGLIV GRLRPGQPLD IDDYLGPELA 
GELEMLDFAN WEQHSEPHPH EVAANWKVTL DTFRENYHFN YLHRKTLRTY AYGGVLTFDP 
LGRHLRNASA LRSIDALRDT PESEWGDVTQ HFSPQYSLFP NTCLTFDSRH VELWQILPVD 
STTSRVLHSV YLRPGLSPEE RAKAVDMAPW ICETVVDGED FWVAGRTEPG IRAGIVDTVV 
FGRNEPAPQH LHHGFTETIQ AYRERKAAQA GESAPAGK