Gene Franean1_2515 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2515
Symbol
ID	5670911
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	2994340
End bp	2995419
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	72%
IMG OID	641241432
Product	alkanesulfonate monooxygenase
Protein accession	YP_001506853
Protein GI	158314345
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.994703
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCATCG AGTTCATCGG TATCGCCAGC ACCTTCGCCG GCAGTGAGTC GGAGGCGTGG 
TCCGGCCCCG CCGTCGACCC GGACTACCTG GAGCGCCTGG TGCGCACGCA CGAGGACGCC 
GGGTTCGACC GGGTGCTCGT CGCGCACAGC TCCGCCATGC CCGACGGCTT CGTCATCACC 
GACCAGATCC TGTCCCGGAC GACGACGTTG AAGGTGCTGC TGGCGCACCG GCCCGGCTTC 
ACCGCCCCGA CGATCGCGGC CCGCCAGTTC GCGACGCTGG ACGCCTTCCA CCCGGGCCGG 
GTGGCGCTGC ACGTCATCAC CGGCGGCGAC GACGCCGACC AGGCCCGCGA CGGGGACCTC 
ACCGACAAGG TGACCCGCTA CCGGCGCACC GACGAGTTCC TGGACGTGCT GCGTTGCGAG 
TGGGAGTCGG CCGAGCCGTT CGACTACGAC GGTGACTTCT ACACGGTTCG CGGTGCCCGC 
TCGTCGGTCC TCCCCGACGG CCGCATCCCC ATCTACTTCG GCGGCGCGTC CGCGGATGCC 
GTCCGGGTCG GTGGCAAGCA CGCCGACGTG TACGCCTTCT GGGGAGAGCC AATCGCCGGA 
ATCGTCGAGC GGATCCGCGA GGTGCGGGCC GCCGCCGAGC CGTACGGCCG CAGCCCCCGG 
TTCAGCGTCA GCCTGCGCCC CATCCCCGCG GACACCGAGC AGGCCGCCTG GCAGCGCGCC 
GCGGACATCC TGGAGCTCAC CAGGCAGCGG GTCGGCGACC TGAAGAAGGT GTTCAACTTC 
GACGGGGCGG CCCAGGTCGG CAGCCAGCGG CTGCTGCGCT ACGCAGACCA GGCGGACGTG 
CACGACAAGC GGCTGTGGAC GGCGGTCGCC AAGGCCACCG GCGCCGCCGG CAACTCCACC 
GCGCTGGTCG GCAGCTACGA GCAGGTCGCC GAGTCGCTCG TCGACTATGT CAACGTCGGG 
GTGTCCACGC TGCTCATCCG CGGCTTCGCG CCGTTGGAGG ACGCCCGGGA CTACGGCACC 
CTGATCCGCC TTGTCCGCGA GCAGACCGCC GACCGCGAGG CCGTCGGCGC CTCCGCCTGA

Protein sequence

MSIEFIGIAS TFAGSESEAW SGPAVDPDYL ERLVRTHEDA GFDRVLVAHS SAMPDGFVIT 
DQILSRTTTL KVLLAHRPGF TAPTIAARQF ATLDAFHPGR VALHVITGGD DADQARDGDL 
TDKVTRYRRT DEFLDVLRCE WESAEPFDYD GDFYTVRGAR SSVLPDGRIP IYFGGASADA 
VRVGGKHADV YAFWGEPIAG IVERIREVRA AAEPYGRSPR FSVSLRPIPA DTEQAAWQRA 
ADILELTRQR VGDLKKVFNF DGAAQVGSQR LLRYADQADV HDKRLWTAVA KATGAAGNST 
ALVGSYEQVA ESLVDYVNVG VSTLLIRGFA PLEDARDYGT LIRLVREQTA DREAVGASA