Gene ECH_0076 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH_0076
Symbol	recF
ID	3927266
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ehrlichia chaffeensis str. Arkansas
Kingdom	Bacteria
Replicon accession	NC_007799
Strand	-
Start bp	67044
End bp	68162
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	29%
IMG OID	637901200
Product	recombination protein F
Protein accession	YP_506906
Protein GI	88658291
COG category	[L] Replication, recombination and repair
COG ID	[COG1195] Recombinational DNA repair ATPase (RecF pathway)
TIGRFAM ID	[TIGR00611] recF protein

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCATCTA TAGAAAAATC TTACATAAAC AATTTGCGAC TAGTAAACTT TCGTAACTAC 
ATAAACCTTG AGCTAGATAC TTCTAGTAAA TCAGTTGTAT TACTTGGAAA AAATGGTGCA 
GGAAAAACAA ATATCTTAGA GGCAATTTCT CTACTATCAA AAGGCACTGG CATTAGAGGA 
GTGAACACAG AAAGCATGCA AAACAGTCTT TCAAATTCCC CATGGAGTGT TTCATATCAA 
ATGCATACAC AAAACGGTAT TTATCCTATT GCAATTTCAC GGAATCACAA CAAACGCGCT 
ATATTAATTA GCAATAAAAA CCAAAGCTAT ACTACATTAC ATAAAATTAC AAGCATCATA 
TGGTTAATAC CACAATTAGA TCATATTTTC TTAAAATCAC AAAGTGAACG ATTAAGATTT 
TTTGACAGAA TAGCACACAT TTTCGATACA AAATACGCTA TACATATTAT AAAATATAAC 
AAAGCAAAGC AGGAAAGAAG CAAGTTATTA TATAACAACT CTATAGATAA CTTTTGGTTA 
TCTAGCTTAG AAAGCATAAT TGCAGAAAAT GGCATAAACA TTGCTCGTAT AAGATTTAAT 
GTTTTACAAA CATTACAAAA CACTCTATCT CAAAATAGCA AATCTCATGC TTTTTTTAAA 
GCAATCATAA AAATTCAAAG CCAAGTATTC AATTTATTAG ACCAAGAAAA TTCTATTGAG 
CTATATAAAG AACATTTAAA AAACAACAGA AGTAAAGATT CACTAAGTAA TTTAGTCAAT 
TTTGGAGTTC ATAACGATAA TTTTCAAATA TTCCATTCAG AAAAAAACTT AATAGCAAAT 
TACTGCTCAA CCGGAGAACA AAAAATTCTA CTACTATCAT TAATTTTATC TTCTGTTTTT 
GCAAAACAAA ACATTGGAGA ATACCCTATC CTATTATTGG ATGACGTTAT GTCTCACCTA 
GATGCATATC ATCAAGAAAA ATTATTAGAA ATCATCAGAG ATATAAAATG TCAAGTATGG 
TTAACAGATA TCGACCTTAC GCAACAAAAT TTTACAAAAC ATAAAGAATA TTTTAAATTT 
TTTCATGTAG CAAATAATAC AGCAACACTC TTGCAATAA

Protein sequence

MSSIEKSYIN NLRLVNFRNY INLELDTSSK SVVLLGKNGA GKTNILEAIS LLSKGTGIRG 
VNTESMQNSL SNSPWSVSYQ MHTQNGIYPI AISRNHNKRA ILISNKNQSY TTLHKITSII 
WLIPQLDHIF LKSQSERLRF FDRIAHIFDT KYAIHIIKYN KAKQERSKLL YNNSIDNFWL 
SSLESIIAEN GINIARIRFN VLQTLQNTLS QNSKSHAFFK AIIKIQSQVF NLLDQENSIE 
LYKEHLKNNR SKDSLSNLVN FGVHNDNFQI FHSEKNLIAN YCSTGEQKIL LLSLILSSVF 
AKQNIGEYPI LLLDDVMSHL DAYHQEKLLE IIRDIKCQVW LTDIDLTQQN FTKHKEYFKF 
FHVANNTATL LQ