Gene Franean1_2018 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2018
Symbol
ID	5670419
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	2424486
End bp	2425922
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	76%
IMG OID	641240939
Product	FAD linked oxidase domain-containing protein
Protein accession	YP_001506361
Protein GI	158313853
COG category	[C] Energy production and conversion
COG ID	[COG0277] FAD/FMN-containing dehydrogenases
TIGRFAM ID	[TIGR00387] glycolate oxidase, subunit GlcD

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.796583
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.304536
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGGCG GGACGGCGGG CGCGGCGGCC GCGGCGGCCG CGGGCGCGGC GTTCGCCTCG 
GCGCTGCCGG CCGGGCGGTG GAGCCAGGAC GGCGCGGTCG TCGACGCCCA CCGGCTCGAC 
CGCTCCGGGT GGCGGCCGCC GGGACGTCCC CTCGGCGTGG CGTTCGCCGG CGGCGTCGAC 
GACGTGCGGG CCGTCCTGCG CACGGCGCTC GCGTCGGGCA CCCCGGTGAC GGTCCGGGGC 
GCCGGGACGG GGCTGGCCGG CGGCGCGGCC GCCCCGGACG GCGCGGTGAT CCTCGACGTC 
AGCGGCATGA ACCGCATCCG CGAGCTGTCG GTGCCCGATG CCGTCGCCGT CGTCGAGCCC 
GGGGTGATCA CCGACGATCT CGACCGGGCC GCCCGGGAGG TCGGGCTGAG CTACTCCCCC 
GACCCGGCCA GCTCGGCGAT CTCCACGATC GGCGGGAACA TCGCGACCAA CGCGGGTGGC 
CTGCGGTGCG CCAAGTACGG CGTGACCCGG GAGTCCGTGC TCGGCCTCGA CGTGGTCCTC 
GCTGACGGGG AGCTGGTCAG CACCGGGCGG CGCACTGTGA AGGGCGTCGC CGGCTACGAC 
CTGACCGGCC TGTTCGTCGG TTCGGAGGGC ACCCTCGGCG TCGTCGTCGG CGCGACGCTG 
CGGCTGCGGC CGGCGCCGCG GCGAACGGTC ACCCTCGCTG CCTTCTTCGA CTCCTTCGGC 
GCCGCGGTGG ACGCGGTCAC CGCGATCATG GCCACCGGAA TCGTGGTGGC CATGGCGGAG 
CTGCTCGACG GGCCGACCGT GCGGGCCGTG GACGCGGCGA CCGGCGGCGA TCTCGCCGAC 
GCCGGCCAGG CCCTCCTGCT CGTCCAGACC GACGGCGCCG GAGCCGACGA CGAGGCCGAC 
GCCGTCGAGG CGGTGCTGCG CGGGCCGGCC CGCGCCGTGC GCCGCGCGGC GGACCCGGCG 
GCCGCGGCCG AACTGCTCGC GGCCCGCCGG GCGGCCCTGC CATCCCTCGA ACGGATCGGC 
CGGGTTCTGA TCGAGGACAT CGCCGTGCCC CGCTCCCAGC TGGCGCGGGC GGCAGCGCGG 
ATCACCGAGA TCAGCGCCGC CACCGGTGTG CGGATCTTCA CCATCGCGCA CGCGGCCGAC 
GGAAACCTGC ACCCGATCAT CGTCGTGGAC GGCTCCGACA GGCTGAACGG AACTGACGGC 
ACCGACGGGC CGGACAGGGC CGCCGACGAG ATCCCCGCCG ACGTCTGGAA GGCCGCCGAC 
CTCATCTTCC AGACCGCGCT GGACCTGGGC GGCACAGTCA CCGGTGAGCA CGGGATCGGC 
GCCCTCAAGC GTCGCTGGCT CGGCGCGGAG CTCGGGACGG CGAACCACTC CCTGCAGCAG 
CGTCTGCGGC ACCTGTTCGA CCCGACCGGG ATCCTGTCCC CCGGCCGCGG CCTGTGA

Protein sequence

MTGGTAGAAA AAAAGAAFAS ALPAGRWSQD GAVVDAHRLD RSGWRPPGRP LGVAFAGGVD 
DVRAVLRTAL ASGTPVTVRG AGTGLAGGAA APDGAVILDV SGMNRIRELS VPDAVAVVEP 
GVITDDLDRA AREVGLSYSP DPASSAISTI GGNIATNAGG LRCAKYGVTR ESVLGLDVVL 
ADGELVSTGR RTVKGVAGYD LTGLFVGSEG TLGVVVGATL RLRPAPRRTV TLAAFFDSFG 
AAVDAVTAIM ATGIVVAMAE LLDGPTVRAV DAATGGDLAD AGQALLLVQT DGAGADDEAD 
AVEAVLRGPA RAVRRAADPA AAAELLAARR AALPSLERIG RVLIEDIAVP RSQLARAAAR 
ITEISAATGV RIFTIAHAAD GNLHPIIVVD GSDRLNGTDG TDGPDRAADE IPADVWKAAD 
LIFQTALDLG GTVTGEHGIG ALKRRWLGAE LGTANHSLQQ RLRHLFDPTG ILSPGRGL