Gene Franean1_4778 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4778
Symbol
ID	5673119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5704335
End bp	5705342
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	73%
IMG OID	641243634
Product	5,10-methylenetetrahydromethanopterin reductase
Protein accession	YP_001509050
Protein GI	158316542
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACG CGAACGATTT TGAGTTATCG TGCGGGCTCC CGCCGGGCCC GGACTTCGCC 
GACCTCGCCG TGCTCGCCGA AGAGCTCGGG TACGCGCGGG TGTGGATCTT CGATTCGGCG 
CCGCTGTGGG AGGACCCGTT CGCGCACCTG GCGCTCGCCG CCACCCGGAC GACCCGGATC 
GGTCTCGCCA CCGCCGTCCT GATCCCGACC CAGCGGTCCG TCATGACGAT GGCCTCCGGC 
ATCGCCACCA TCGCCCGGCT GTCCGGCGGC CGCTTCCGGG CCTGCTTCGG TACCGGCTAC 
ACGGCACGCA TGACGATCGG GCAGCGTGCG ATGCCGCTGG ACGCGCTGTT CGACTATGCC 
GCGTCGGTCC GCAAGCTGCT TGCCGGCGAG ACGATCGTGC TCGACGGCGA GGCGGCCCGG 
ATGCTGCACT GGCCCGGCCT GACCGCCGCC CGGCCGGTCC AGGTGCCGCT GTGGCTCAGC 
GTCCTCGGCC CGCGCGGCAA CAAGCGCGCC CCCGAGGTGG CTGACGGCAC GATCGGGCCG 
CCCCACCCGA CGCTGCCGAC CGCGACGATG GTCTCGGGCA CCGTGCTGGA CCCCGGCGAG 
GACCCGAGCT CCAGCCGCGT ACGGGAGGCG ATCGGCCCGT GGCAGGTCGT CGGCTGGCAC 
ACCACCTATG CCGTCCGTGG GGCGGCCGGG GTGGACGCCC TGCCCGGTGG CTCGCAGTGG 
CGGAAGGCCC TCGAGGGCCT GGCCTCCGAG GAGGAGCGCC ACCTGCTCAC CTTCGAGGGC 
CATGTCACCC ACCTCTCCGA GCGTGACCGG CCCCTGCTGG AGCACATCGA CGTCGACACC 
ATGGCCGGCG ATGTCTACGT CGGCACCCTG GTCGGTGATT CCGTCAGCGT CGGACGGAAG 
CTCGGCAGGC TCGCCGAGGC GGGGTTCCGC GAGGTCATGT ACACGCCCGC TGGCCCGGAC 
GTCGCCCGCG AGCTGCGCGC CTTCGCCGCC GCCAGCCCTT CGGGATAG

Protein sequence

MTDANDFELS CGLPPGPDFA DLAVLAEELG YARVWIFDSA PLWEDPFAHL ALAATRTTRI 
GLATAVLIPT QRSVMTMASG IATIARLSGG RFRACFGTGY TARMTIGQRA MPLDALFDYA 
ASVRKLLAGE TIVLDGEAAR MLHWPGLTAA RPVQVPLWLS VLGPRGNKRA PEVADGTIGP 
PHPTLPTATM VSGTVLDPGE DPSSSRVREA IGPWQVVGWH TTYAVRGAAG VDALPGGSQW 
RKALEGLASE EERHLLTFEG HVTHLSERDR PLLEHIDVDT MAGDVYVGTL VGDSVSVGRK 
LGRLAEAGFR EVMYTPAGPD VARELRAFAA ASPSG