Gene Franean1_1410 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1410
Symbol
ID	5669816
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	1706233
End bp	1707504
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	63%
IMG OID	641240333
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_001505760
Protein GI	158313252
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.190649
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACTCGTT GGCCCAAGCC GCCCGAAGGC AGCTGGACGG AGCATTACCC GGAGCTCGGA 
ACCGAGCCTG TTTCCTACGA GGACTCGATC TCGCCCGAAT TATATGATCT TGAGCGGGAG 
GCAATCTTCA AGCGCGGCTG GCTCAATGTC GGCCGGGTGG AGCTGCTGCC AAAGAACGGC 
AGCTACTTCA CCAAGGAGAT CCACATAGCC AAGACCTCGG TCATCGTCCT GCGGGACAGG 
AGCGGCCAGG TGCGGGCGTT CCACAACATC TGCAGGCACC GCGGCAACAA GCTGGTGTGG 
AACGACTTCC CGAACGAGGA GACCAGCGGC ACCTGCCGTC AGTTCACCTG CAAGTACCAC 
GCCTGGCGTT ACGACCTCGA CGGTTCGCTG AACTTCATCC AGCAGGAGGG CGAGTTCTTC 
AACCTCGACA AGAACGACTA CGGGCTCGTT CCCGTCCACT GCGACGTGTG GCAGGGCTTC 
ATCTTCATCA ACCTCGCGAA GGAGCCCGAG CAGCAGCTGT CGGACTTCCT CGGCCCCATG 
ATCACCTCTA TCGAGGGTTA CCCCTTCGAC AAGATGACCG AGCGGTGGTA CTACCGTTCG 
GAGATCAAGG CCAATTGGAA GCTCTACATG GATGCCTTCC AGGAATTCTA CCACGCACCG 
ATCCTGCACG CGCGACAGTC GCCGGCCAAG TTCGCCAACT CCGCGCAGCA GGCCGGGTTC 
GAGGCACCGC ACTACCGCAT CGACGGCCCG CACCGCCTGG TGAGCACCGC CGGGATTCGG 
GCGTGGGAAC TCGAGCAGGA TCTGCGCAAG CCGATCGAGG AAATCACCCG CAGCGGTCTG 
TTCGGGCCCT GGGACATCCC CGACCTCGGC ATCGAGAAAA TGCCGGCGGG TATCAACCCG 
GCCGGGTGCG ACCCGTGGGG CCTCGACTCG TTCCAGCTCT TCCCGAACTT CACGATCCTG 
ATCTGGGGCC AGGGCTGGTA CCTCACATAC CACTACTGGC CGACGGCCTA CAACAGCCAC 
ATCTTCGAGG GCACCCTCTA CTTCATTCCC GCGAAGACGC CGCGGGAGCG GGTGGCCCAC 
GAGCTGACGG CGCTGTCCTT CAAGGAGTTC GGCCTGCAGG ACGCCAACAC GCTCGAGGCG 
ACACAGACGA TGATGGAGTC CCGGGTGGTC GACCGGTTTC CGCTGGGGGA CCAGGAGGTG 
CTGTGCCGGC ACCTCCACAA GGAGACGGCC GACTGGATCG AGAAGTACCA GCGCGAACGA 
GCGGGAGCGT GA

Protein sequence

MTRWPKPPEG SWTEHYPELG TEPVSYEDSI SPELYDLERE AIFKRGWLNV GRVELLPKNG 
SYFTKEIHIA KTSVIVLRDR SGQVRAFHNI CRHRGNKLVW NDFPNEETSG TCRQFTCKYH 
AWRYDLDGSL NFIQQEGEFF NLDKNDYGLV PVHCDVWQGF IFINLAKEPE QQLSDFLGPM 
ITSIEGYPFD KMTERWYYRS EIKANWKLYM DAFQEFYHAP ILHARQSPAK FANSAQQAGF 
EAPHYRIDGP HRLVSTAGIR AWELEQDLRK PIEEITRSGL FGPWDIPDLG IEKMPAGINP 
AGCDPWGLDS FQLFPNFTIL IWGQGWYLTY HYWPTAYNSH IFEGTLYFIP AKTPRERVAH 
ELTALSFKEF GLQDANTLEA TQTMMESRVV DRFPLGDQEV LCRHLHKETA DWIEKYQRER 
AGA