Gene Franean1_6914 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6914
Symbol
ID	5675227
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	8423025
End bp	8424320
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	66%
IMG OID	641245763
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_001511154
Protein GI	158318646
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCATCC AGGAAAAACT TGCGACCGGT AGAGGCAAGT ACACACCGGG GTACCCGAAC 
CTCGACACCG GGCCGGTCGA CTACGAGGAC TCGATCTCCG AAGAGTTCTT CCAGGCCGAG 
CGCGAGGCGA TCTTCAAGCG GACCTGGCTG AAGGTCGGCC GGATGGAGCA GCTGCCCCGC 
AACGGCACGT TCTTCACCCG CGAGTTCGTC GGCCTGGGGT CGATCGTGAT CACCCGGCAC 
ACCGACGGCG AGGTGTACGC GCTGCACAAC ATCTGCGCGC ACCGCGGCAA CAAGGTCGTC 
TGGCAGGAGC ACCCGACCAA CGAGACCCAG GGCAGCGCCC GGCAGTTCGC CTGCAAGTAC 
CACGGCTGGC GCTACGGCCT CGACGGCAAG TGCACCTACG TCACCAAGCG GAACGAGTTC 
TTCGAGTCGC TGCCCGACGA CGAGCTCGCC ATGCCGCAGC TGCGCTGCGA GGTCTTCGCC 
GGGTTCATCT TCGTGAACTT CAGCCAGGAC GCTCCGCCGC TGCGCCAGTT CCTCGGTGAG 
AAGCTGGCCA CCGAGCTGGA GAGCTGGCCG TTCGAGAAGT TCACCAACCA CTGGTCCTTC 
CGGACGAAGG TCAAGGGCAA CTGGAAGATC GGCATCGACG CGCTGCTGGA GTGGTACCAC 
CCGGCGTACG TCCACGGGCG GTTCCTCAAC ACCAACGTGG CCGAGGCGGA GAAGCTCGTC 
CCGCCGATGG ACTCCTACCA TTACGACCTG TTCACCCCGC ACATGCTGAC CTCGGTGCCC 
GGCCCGCCGC TGCTGAAGAA GAAGCAGGGC TCGGTCGGCC CGGCCAAGCG GGACATGAAC 
TGGGCCTACC GGCTGTTCCG CGCCGGCCTG TTCGGCCCGG ACGACGTCCG CGAGGACCTC 
GGCCACCTCA CCCCGGACCG CAACCCCGGC AACGTCCAGT CCTGGAGCAA CGACCAGTAC 
TGGCTGTTCC CGAACCTGTC GGTCCAGCTC TGGGGCCGCG GGTACTACAT CACCTACCAG 
TACATCCCGG AGACGGTGGG CACCCACGCC TACGAGGTCG ACATCTACTT CCCGGAACCG 
AAGACCGCCT CCGAGCGCCT CGCCCAGGAG CTCGTCGTCG ACAGCACCAT CGAGTTCGCG 
ATGCAGGACA CGAACACGGT GGAGGCGACC TGGTCGCAGC TCAACAACCG CGCGCTGCAG 
ACGTTCCACC TGTCCGACAT GGAGCTGATG ATCCGTCAGT TCCACAAGGT TGTCCGGGAC 
GCCGTCGCGG CGCACCAGGC CGGCAGCGAG AAGTAG

Protein sequence

MAIQEKLATG RGKYTPGYPN LDTGPVDYED SISEEFFQAE REAIFKRTWL KVGRMEQLPR 
NGTFFTREFV GLGSIVITRH TDGEVYALHN ICAHRGNKVV WQEHPTNETQ GSARQFACKY 
HGWRYGLDGK CTYVTKRNEF FESLPDDELA MPQLRCEVFA GFIFVNFSQD APPLRQFLGE 
KLATELESWP FEKFTNHWSF RTKVKGNWKI GIDALLEWYH PAYVHGRFLN TNVAEAEKLV 
PPMDSYHYDL FTPHMLTSVP GPPLLKKKQG SVGPAKRDMN WAYRLFRAGL FGPDDVREDL 
GHLTPDRNPG NVQSWSNDQY WLFPNLSVQL WGRGYYITYQ YIPETVGTHA YEVDIYFPEP 
KTASERLAQE LVVDSTIEFA MQDTNTVEAT WSQLNNRALQ TFHLSDMELM IRQFHKVVRD 
AVAAHQAGSE K