Gene Francci3_0004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0004
Symbol	recF
ID	3902950
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	3698
End bp	4897
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	71%
IMG OID	637877333
Product	recombination protein F
Protein accession	YP_479127
Protein GI	86738727
COG category	[L] Replication, recombination and repair
COG ID	[COG1195] Recombinational DNA repair ATPase (RecF pathway)
TIGRFAM ID	[TIGR00611] recF protein

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.000897119
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCACCTCA CGCACCTGTC CCTCGTCGAC TTCCGTTCCT ACCCGGCCCT TGACCTGACT 
CTGGGTCCGG GAGTGGCCAC CTTCGTGGGT GGTAACGGCC AGGGGAAGAC CAACGTGATC 
GAGGCGATCA GCTATGTCGC CACGTTGGCC AGCCACCGGG TCGCCGGGGA CGCCCCGCTG 
GTCCGTGACG GCGCGTCTCG GGCGGTCATC CGCGCCAGGA TCGTCCGGGG TGACCGGGCC 
GCGCTGGTGG AGATCGAGAT CGTTCCGGGA AAGGCGAACC GGGCCCGGTT GAACCGGGCT 
CCCGTCGCCC GGCCGCGTGA CATCGTCGGT CTGCTGTGCA CCGTGCTGTT CGCCCCGGAG 
GACCTGGCCC TGGTGAAGGG GGATCCGGCG CAGCGTCGTC AGTTCCTCGA CGAGCTGCTG 
ATCGCCCGGA CCCCAAGGAT GGCCGCGGTC CTCGCCGACT ACGACCGGGT CCTCAAACAA 
CGATCGACCC TGCTACGCAC CGCCGGGACG GCCCGGCGAG CTGGGGGGCA GGGAGATCTG 
CGCACCCTCG ATGTCTGGGA CGGGTATCTG GCCGCGCATG GCGCCGAGGT GCTGGCCGCG 
CGGTTGGCAC TCGTCGACGC GTTGCGGCCG GCCGTGGCCG CGGCGTACGA GGCCGTCGCC 
GGCGCCGAGT CCGCTACCGC GCTGGACTAC CGTTCCAGCG TCACCCTCCC GGACATCTTG 
CATGCGTCCG GTCCACCCGG TCCACCGGGC CAGCCAGAGC AGCCGGGCGC GGGTCGGCCG 
GATCCGGCGG CACCGGATCG GACCATGCTG GCGGAGGCGA TCCGCGCCGA TCTGGAGGCC 
GCCCGGCCAC GGGAGGTCGA ACGGGGGATG ACGCTGGTCG GTCCGCACCG CGACGATCTG 
CTCTTGTCGA TCAACGGGCT CCCGGCCCGT GGCTACGCGA GTCACGGCGA GTCCTGGTCC 
CTCGCCCTCG CGCTCAAGCT GGCCTCGTTC GACCTGCTGC GTGCCGATGA CCGCGAGCCG 
GTCCTGCTCC TGGACGACGT CTTCGCCGAA TTGGACACGC GCCGCCGCGG TCGGCTCGCG 
GAACTCGTCG CCTCCGCGGA GCAGGTGCTG GTCACAGCCG CGGTCGAAAC CGACGTTCCC 
ACAGAGCTGA CCGGGGTGCG GTACGCCGTC GCCGGAGGAG AGGTCCAGCA TGCCCACTGA

Protein sequence

MHLTHLSLVD FRSYPALDLT LGPGVATFVG GNGQGKTNVI EAISYVATLA SHRVAGDAPL 
VRDGASRAVI RARIVRGDRA ALVEIEIVPG KANRARLNRA PVARPRDIVG LLCTVLFAPE 
DLALVKGDPA QRRQFLDELL IARTPRMAAV LADYDRVLKQ RSTLLRTAGT ARRAGGQGDL 
RTLDVWDGYL AAHGAEVLAA RLALVDALRP AVAAAYEAVA GAESATALDY RSSVTLPDIL 
HASGPPGPPG QPEQPGAGRP DPAAPDRTML AEAIRADLEA ARPREVERGM TLVGPHRDDL 
LLSINGLPAR GYASHGESWS LALALKLASF DLLRADDREP VLLLDDVFAE LDTRRRGRLA 
ELVASAEQVL VTAAVETDVP TELTGVRYAV AGGEVQHAH