Gene EcHS_A3913 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3913
Symbol	recF
ID	5591870
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3907319
End bp	3908392
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	55%
IMG OID	640923021
Product	recombination protein F
Protein accession	YP_001460498
Protein GI	157163180
COG category	[L] Replication, recombination and repair
COG ID	[COG1195] Recombinational DNA repair ATPase (RecF pathway)
TIGRFAM ID	[TIGR00611] recF protein

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.00221081
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCCTCA CCCGCTTGTT GATCCGCGAT TTCCGCAACA TTGAAACCGC GGATCTCGCC 
TTATCTCCCG GCTTTAACTT TCTGGTAGGT GCCAACGGCA GTGGCAAAAC CAGCGTGCTG 
GAAGCCATCT ATACGCTCGG CCATGGTCGG GCGTTTCGCA GTTTGCAGAT TGGTCGCGTC 
ATTCGCCATG AGCAGGAGGC GTTTGTTCTC CACGGGCGAT TACAGGGCGA AGAGCGCGAG 
ACAGCGATTG GCTTAACCAA AGACAAACAG GGCGACAGCA AAGTCCGCAT CGACGGTACA 
GACGGGCATA AGGTCGCGGA ACTGGCGCAC CTGATGCCAA TGCAGTTGAT AACGCCAGAA 
GGGTTTACTT TACTCAACGG CGGCCCCAAA TACAGAAGAG CATTCCTCGA CTGGGGATGC 
TTTCACAACG AACCCGGATT TTTCACCGCC TGGAGCAATC TCAAGCGATT GCTCAAGCAG 
CGCAATGCGG CGCTGCGCCA GGTGACACGT TACGAACAGC TACGCCCGTG GGATAAAGAG 
CTGATCCCGC TGGCGGAGCA AATCAGCACC TGGCGCGCGG AGTATAGCGC CGGTATCGCG 
GCTGATATGG CCGATACTTG TAAGCAATTT CTCCCTGAGT TTTCTCTGAC TTTCTCTTTC 
CAGCGCGGCT GGGAGAAAGA GACAGAATAT GCTGAGGTGC TGGAACGTAA TTTTGAACGC 
GATCGCCAGC TAACCTACAC CGCGCATGGC CCGCATAAAG CGGACTTACG CATTCGCGCC 
GACGGTGCGC CGGTGGAAGA TACCTTATCG CGTGGGCAGC TTAAGCTGTT GATGTGCGCC 
TTACGTCTGG CGCAAGGAGA GTTCCTCACC CGTGAAAGCG GGCGGCGGTG TCTCTACCTG 
ATAGATGATT TTGCCTCTGA GCTTGATGAT GAGCGTCGCG GGCTGCTTGC CAGCCGCTTA 
AAAGCGACGC AATCACAGGT CTTTGTCAGC GCGATCAGTG CTGAACACGT TATAGACATG 
TCGGACGAAA ATTCGAAGAT GTTTACCGTG GAAAAGGGTA AAATAACGGA TTAA

Protein sequence

MSLTRLLIRD FRNIETADLA LSPGFNFLVG ANGSGKTSVL EAIYTLGHGR AFRSLQIGRV 
IRHEQEAFVL HGRLQGEERE TAIGLTKDKQ GDSKVRIDGT DGHKVAELAH LMPMQLITPE 
GFTLLNGGPK YRRAFLDWGC FHNEPGFFTA WSNLKRLLKQ RNAALRQVTR YEQLRPWDKE 
LIPLAEQIST WRAEYSAGIA ADMADTCKQF LPEFSLTFSF QRGWEKETEY AEVLERNFER 
DRQLTYTAHG PHKADLRIRA DGAPVEDTLS RGQLKLLMCA LRLAQGEFLT RESGRRCLYL 
IDDFASELDD ERRGLLASRL KATQSQVFVS AISAEHVIDM SDENSKMFTV EKGKITD