Gene Franean1_3942 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3942
Symbol
ID	5672303
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4711200
End bp	4712195
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	75%
IMG OID	641242821
Product	ferredoxin
Protein accession	YP_001508238
Protein GI	158315730
COG category	[C] Energy production and conversion
COG ID	[COG1018] Flavodoxin reductases (ferredoxin-NADPH reductases) family 1
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.51179
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0171714
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCTCGT CCCCGTCCAC CGTGGATCGA GCCGAACAGC GGCAGACGCT GACGCTGACG 
GTCCGCGCCC GCCGCCACGT CGCCGAGGAT GTCGTCTGTT TCGATCTGGC CGATCCGATC 
GGCGCCGCAT TGCCGCCCTG GACACCCGGC GCGCATGTCG ACGTCACGGT GCGGCCGGGG 
ACGGTGCGGC AGTACTCGCT GTGCGGTGAT CCAGCGGATC GCCACCATTG GCGGATCGCG 
GTGCTGCGGG AGGCCGCCGG CCGCGGCGGT TCGGTGCACC TGCACGACCG GGTCGGTGCC 
GGCGCGTTGC TGCCGGTAGG GCAGCCGCGC AACGCGTTCC CCCTGGTCGC CGCGCCGCGC 
TACCTGCTGG TCGCCGGCGG GATCGGCGTC ACCCCGCTGC TGCCGATGAT CGACGAGCTC 
GCCGCGCGTG GCGCCGAGTG GCGGCTGCTC TACGGCGGGC GCCACCGCGC GGCGATGGCC 
TTCGCCGACG ACCTCGCCCG CCACGGCGAC CGGGTCGTCC TGCACCCGCA GGACACCCAC 
GGGCTGCTTC CCCTCGGCCC CGTCCTGGAC GGCCTGCGTG CCTCCGGCGA GCACGAGGAG 
ACGGCGGTCT ACTGCTGCGG GCCCGAGGGT CTGCTCGGGG CCATCGAGGG GCACTGCGCG 
CAGTGGCCCG CCGGCGCCCT GCACGTCGAG CGGTTCCACC CCGCAGAGCC CGCCCACCGC 
GACACCGACG GCGCCTTCGA GCTGTGCCTG GCCCGTAGCG GGCGGGTGCT GCGGGTCGGG 
CCCGGGCAGT CGGTCCTGGA GGTGCTGGAG GCGGCCGGGG CCGCCGTCAC CTCCTCCTGC 
CGGGACGGTA CGTGCGGCAC CTGCGAGACG CCGGTGGTCG AGGGCGGTGT CGACCACCGT 
GACACCGTCC TGACCCCGGC CGAGCGCGAC GGCGGCCGGA CGATGATGGT CTGCGTCTCG 
CGTGGCCTGG GCGGACGTCT CGTCCTGGAC ATCTGA

Protein sequence

MSSSPSTVDR AEQRQTLTLT VRARRHVAED VVCFDLADPI GAALPPWTPG AHVDVTVRPG 
TVRQYSLCGD PADRHHWRIA VLREAAGRGG SVHLHDRVGA GALLPVGQPR NAFPLVAAPR 
YLLVAGGIGV TPLLPMIDEL AARGAEWRLL YGGRHRAAMA FADDLARHGD RVVLHPQDTH 
GLLPLGPVLD GLRASGEHEE TAVYCCGPEG LLGAIEGHCA QWPAGALHVE RFHPAEPAHR 
DTDGAFELCL ARSGRVLRVG PGQSVLEVLE AAGAAVTSSC RDGTCGTCET PVVEGGVDHR 
DTVLTPAERD GGRTMMVCVS RGLGGRLVLD I