Gene Franean1_4576 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4576
Symbol
ID	5672923
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5458891
End bp	5459958
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	72%
IMG OID	641243439
Product	putative oxidoreductase
Protein accession	YP_001508855
Protein GI	158316347
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03559] probable F420-dependent oxidoreductase, Rv3520c family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.248726
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.45285
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGGGTCG GGATGCCGCT GAAGTACTCC GGCGGCTTCA CCGAGACCGT CGCGGACCTT 
CGCGACTTCG AGGCGGCCGG GCTCGACCTG GTCATGCTCC CGGAGGCCTA CAGCTTCGAC 
TCGGTGAGCC AGCTGGGCTA CCTGGCGGCC CGGACCTCGA CGGTGCTGCT GGCCACGAGC 
ATTCTGAACA TCTACTCGCG CACCCCGGCC CTGCTGGCCA TGACGGCGGC CGGGCTGGAC 
TACGTGTCCG ACGGCCGCTT CGTGCTCGGC CTGGGCGCGT CGGGGCCGCA GGTGATTGAG 
GGGTTCCACG GCGTGCGCTA CGACGCCCCG CTCGGGCGCA CCCGCGAGGT CGTCGAGATC 
TGCCGGGCGG TCTGGCGGCG CGAGCGGCTC AGCTACGAGG GCCGGCACTA CCACCTGCCG 
CTGGATGCCG CGCACGGCGG CAGCGGCCTG GGGAAGCCGC TGAAGCTGAT CAACCACCCG 
GTCCGGTCCG CGGTGCCGAT CGTGCTCGCC GCGCTGGGAC CCCGCAACGT CGAGCTGGCC 
GCCGAGATCG GTGACGGGTG GGAGCCGATC TTCTACCTCC CCGAGGCGGC GCCGGCCGCC 
TTCGGTGAGC CGCTGGGCCC GCTCGACATC GTGGTGCCCA CCCAGCTGCT GATCAGCGAC 
GACGCCGACG AGATCGAGGC CGCGGTCCAG GCCGTGCGCG AGCACCTCGC GCTCTACGTC 
GGCGGCATGG GCGCCCGGGG CCGGAACTTC TACAACGAGC TCGCCGGCCG CTACGGGTTC 
GCGGCGGCGG CCGCCGAGGT GCAGGACCAC TACCTCGCCG GGCGCAAGGC GCAGGCCGCT 
GCCGCGGTGC CGGAGCGGCT GGTGCGCGGT GTCTCGCTGA TCGGACCGCC CGGGTATGTG 
CGGGAGCGGG TGGCGGCGTT CGCCGAGAGC GGGGTGACGA CGCTGAACGG GCTGCCGCTG 
GCCGGCACCC ACCGCCGGCG GCTCGCCGAC GTCGAGCGGC TCAAGGAGTA CGTGTCGTCG 
ACGCTTCCCG GAACTTATCG TGATAGGTAT AATGAGCTAA CTAATTGA

Protein sequence

MRVGMPLKYS GGFTETVADL RDFEAAGLDL VMLPEAYSFD SVSQLGYLAA RTSTVLLATS 
ILNIYSRTPA LLAMTAAGLD YVSDGRFVLG LGASGPQVIE GFHGVRYDAP LGRTREVVEI 
CRAVWRRERL SYEGRHYHLP LDAAHGGSGL GKPLKLINHP VRSAVPIVLA ALGPRNVELA 
AEIGDGWEPI FYLPEAAPAA FGEPLGPLDI VVPTQLLISD DADEIEAAVQ AVREHLALYV 
GGMGARGRNF YNELAGRYGF AAAAAEVQDH YLAGRKAQAA AAVPERLVRG VSLIGPPGYV 
RERVAAFAES GVTTLNGLPL AGTHRRRLAD VERLKEYVSS TLPGTYRDRY NELTN