Gene Franean1_4357 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4357
Symbol
ID	5672712
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	5201223
End bp	5202491
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	64%
IMG OID	641243230
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_001508647
Protein GI	158316139
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCACT TCACCAAGCC CGTCGAGGGC AGCTGGACAG AGCACTTCCC CACCCTCGGA 
ACCGACTTCG TCTCGTTCGA GGACTCGATC TCACCGGAGC ACTACGAGTT GGAACGCAAG 
GCGATCTTCG AGCGGAGCTG GCTCAACGTC GGCCGCGTGG AGCAGATCCC GAAGCGGGGA 
AACTACTTCA CCAAGGAGAT CCAAGCCGCC CGCGCCTCGA TCATCGTCGT CCGCGACAAC 
GAGGACCAGA TCCGCGCCTT CCACAACGTC TGCCGCCACC GCGGCAACAA ACTGGTGTGG 
AATGACTTCC CGCACGAGGA GGTCGCGGGC ACCGCGCGCC AGTTCCAGTG CAAGTACCAC 
GCCTGGCGCT ACGGGCTCGA CGGCACCTGC ACCTTCGTCC AGCAGGAGGC GGAGTTCTTC 
GACCTCGACA AGTCGAAGCT CGGTCTCGCG GCGGTGCGCT GCGAGGTTTG GGAGGGCTTC 
ATCTTCATCA ACCTCGACAA CGAGGACACC ACCCCGGTGC GCGAGTACCT CGGGCGGTTC 
GCGAAGGGCA TGGAGGGCTA CCCGTTCGAC CAGATGACCG AGGTCTACCG GTACCGGGCG 
CACGTCAAGA GCAACTGGAA GCTCTACATA GACGCGTTCG CCGAGTTCTA CCACGCACCC 
GTCCTGCACG CGAAGCAGTA CGTCGGCACC GAGTCCCGCA AACTCATAGG CTACGGCTAC 
GAGGGGCTGC ACTACGACCT CGATGGCCGG CACTCGATGC AGTCCGCGTG GGGCGGCATG 
TCGCCACCCA AGGACCTCTC CATGGTGAAG CCGATCGAGC GGATTCTGCG CAGCGGCAAC 
TTCGGGCCAT GGGACCGTCC CGACATCACG GGTCTCGACC CGCTACCCGG GGGCGTCAAC 
CCGTCGGGCC ACCGGGCATG GGGCAACGAC TCGTACCTGT TCTTCCCGAA CTTCATGATC 
CTGATCTGGG CGCCGGGCTG GTATCTCACA TACCACTACT GGCCGACCGC GTACAACGAG 
CACATCTTCG AGGGAACGCT GTACTTCGTC CCGCCGAAGA ACGCGGCGGA GCGCCTGCGG 
CACGAACTGG CCGCGGTCAC CTTCAAGGAG TTCGCGCTAC AGGACTGCAA CACCCTCGAG 
GCGACGCAGA CCATGCTCGA GTCCCGCGCG GTCCGGGATT TCCCGCTCAA CGACCAGGAG 
ATCCTCATCC GTCATCTCCA CAAGTCCGCG AACGACGTCG TCGCCGCCTA CCAGGCCGCG 
ACGAAATGA

Protein sequence

MAHFTKPVEG SWTEHFPTLG TDFVSFEDSI SPEHYELERK AIFERSWLNV GRVEQIPKRG 
NYFTKEIQAA RASIIVVRDN EDQIRAFHNV CRHRGNKLVW NDFPHEEVAG TARQFQCKYH 
AWRYGLDGTC TFVQQEAEFF DLDKSKLGLA AVRCEVWEGF IFINLDNEDT TPVREYLGRF 
AKGMEGYPFD QMTEVYRYRA HVKSNWKLYI DAFAEFYHAP VLHAKQYVGT ESRKLIGYGY 
EGLHYDLDGR HSMQSAWGGM SPPKDLSMVK PIERILRSGN FGPWDRPDIT GLDPLPGGVN 
PSGHRAWGND SYLFFPNFMI LIWAPGWYLT YHYWPTAYNE HIFEGTLYFV PPKNAAERLR 
HELAAVTFKE FALQDCNTLE ATQTMLESRA VRDFPLNDQE ILIRHLHKSA NDVVAAYQAA 
TK