Gene Franean1_3259 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3259
Symbol
ID	5671633
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3859595
End bp	3860647
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	69%
IMG OID	641242151
Product	luciferase family protein
Protein accession	YP_001507571
Protein GI	158315063
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03560] probable F420-dependent oxidoreductase, Rv1855c family [TIGR03621] probable F420-dependent oxidoreductase, MSMEG_2516 family

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGCTC CTGCTCCGGC CAGACCGCTC CACAACCACG GCGGGGCCCC AGTCCGCGGA 
ATCCGACTGA AGATCCAGGT GGTCACGATG AACCAGAAGC CGTTCCGCTT CGCTGTACAG 
GGCACGCGCG CCACCTCGGG CCGCGAGTGG TACGACCTGG CCCGCAAGGC TGAGGCCCTC 
GGGTACTCGA CGCTCTTCGT CGCGGACCAC TACCTCGGGC CGGGCCCCGC GGCCCGGGCC 
TGCAGCATGC CGCCGCAGCA CCTGGCGCCG GTCTCGGCGA TGGTCGCCGC CGCCGCGGTC 
ACCTCGACCC TGCGGGTCGG CTGCCGGGTC TTCTGCATCG ACTACCACGT GCCCGCGGCC 
CTGGCGAAGG AGGCCGCGAC CATCGATCTG CTCTCCGAGG GCCGGCTCGA GATGGGTATC 
GGCGCCGGAG TACAGGTCAA CGAGTACAAG GCCCTCGGCA TCCCCTTCCT GCCCGGCAAG 
GAGCGGGTCG ACAAGCTTGA GGAGGTGATC GCCCTGTTCA GGGCGCACTG GTCCGGTGAG 
CCGATCGACC TCAGCGGCGA GCACGTCGAT GTCCACGGCT ACCGGGGGCT GCCGCGGCCC 
GCCCAGAAGC CGCACATCCC GCTGATGATC GGCGGGAATC GGAAGCGCAT GCTCTCGCTG 
GCGGCCAGGG AGGCCGACAT CGTCAGTATC GGCAACGTGC CCTTCGACCC GCTGAACGCC 
TCCGGCCTCA CCCCCAGGCA GGAGGCGGTG CACCGGTACG AGGTGGTGCG TGCTGCCGCC 
GGCGAGCGCC TGGACGAGAT CGAGATCGAA GGATCGCCCT ACTTCACCAT TCTGACGGAG 
GACCGCGATT CGGCGTACAA CGAGATCGCC AGCTGGATCT CGGTCGACGC GTCGGTGCTC 
CCCGAGCACC CCAACGTTCT GGTCGGCACG CTCGACGAGA TGGAGCAGCG GCTGCGCGCC 
AACCGGGAGG AGCTCGGCAC GAACTATGTG ACCGTTCCCC AGAACGCCAT CGACACGTTC 
GCGCCTCTGG CCGAGCGGCT GCGGGGGAAA TGA

Protein sequence

MAAPAPARPL HNHGGAPVRG IRLKIQVVTM NQKPFRFAVQ GTRATSGREW YDLARKAEAL 
GYSTLFVADH YLGPGPAARA CSMPPQHLAP VSAMVAAAAV TSTLRVGCRV FCIDYHVPAA 
LAKEAATIDL LSEGRLEMGI GAGVQVNEYK ALGIPFLPGK ERVDKLEEVI ALFRAHWSGE 
PIDLSGEHVD VHGYRGLPRP AQKPHIPLMI GGNRKRMLSL AAREADIVSI GNVPFDPLNA 
SGLTPRQEAV HRYEVVRAAA GERLDEIEIE GSPYFTILTE DRDSAYNEIA SWISVDASVL 
PEHPNVLVGT LDEMEQRLRA NREELGTNYV TVPQNAIDTF APLAERLRGK