Gene Cagg_0434 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0434
Symbol
ID	7266602
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	538220
End bp	539398
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	58%
IMG OID	643565301
Product	DNA replication and repair protein RecF
Protein accession	YP_002461815
Protein GI	219847382
COG category	[L] Replication, recombination and repair
COG ID	[COG1195] Recombinational DNA repair ATPase (RecF pathway)
TIGRFAM ID	[TIGR00611] recF protein

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.626531
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACATTC ATCACCTTGC TTTGCGCGAT TTTCGTAACT ACCGGCGGCA AGATGTGGCC 
CTCTCGCCGA CAACGATCCT CTTGTACGGC CCGAATGCTG CCGGTAAGAC GAGCCTCCTT 
GAGGCTATTT TTTATCTCGC CACTACGCGC TCGCCTCGCC TCAGCAGCGA TCGCGACCTC 
GTGCGCTGGG ATGCAGTCGG TGAAGCCGGC GCGCCACCTT TTGCCCGCAT TGCAGCCGAT 
GTTGAGCGTC GGATCGGACC GGTACGGCTT GAGATACTGG TACAGCGCCG GCTCGATGAT 
GGTGGTCAGC CGCTAAACGG CGCGCAAAAA TTGGTGCGGA TCGATAAGCG CCCGGCGCGC 
GCGATTGATC TGATCGGTCA GTTGCGGGTA GTGCTCTTTA CCCCTACCGA TGTCATGCTG 
GTTGATGGCC CCCCTGCCGA ACGGCGGCGC TACCTCGACA TTACCCTCTC ACAGCTCGAT 
CCGCACTACG TGCGAACCCT GGCGTATTAC CAGAAGATTC TGTTGCAACG CAATAGTCTC 
TTGCGCGCAT GGCGTGAACA ACGTCGCTTG CCCCGCAATG TTGATGCCGA GTTAGGGTAT 
TGGGATCAAG AGCTGGCCGC TGCCGGAGGA TATTTGTTGG CCGAACGGTT GCGGGCCGTT 
GTCGAATTGA GCGCGCTGGC CGGGTCCATT TACCGAAAGA TTAGCGGTGG CGAACACGAA 
TTGCAGATTG AATATATCGC CAGTTGTGAC CTCGACGCAG CGCGCGATGC CGGTAGTCTA 
GCCGAGCGAC TACGTTTAGC GTTTGCCGCT CAGCGTACCG ATGAGCTGGC CCGTGGGCAG 
ACACTCTGCG GACCACACCG TGATGATCTG GTTTTTAACG TTGCCGGTGT GAATCTTGGT 
CGGTATGGTT CGCGTGGTCA ACAACGTACC ATTGCCCTTG CGCTCAAGAT CGGTGAAGCC 
GAACTGATGC AGCAACGCGG TGGTGATGCA CCGGTGCTCT TACTCGATGA TGTTTTGAGC 
GAACTCGACA ACCGACGTCG CATGCATTTG CTTGACCTTA TTCTGCGCCC GCAACAGCAG 
ACACTGCTCA CGGCCACCAA TCTGAGCGAC TTTAGTGCTG ATTTTCTCGC TGCCGCCCGT 
CGCTTTCGGG TCGAAGATGG TCAGCTTTTT GCCGGTTGA

Protein sequence

MYIHHLALRD FRNYRRQDVA LSPTTILLYG PNAAGKTSLL EAIFYLATTR SPRLSSDRDL 
VRWDAVGEAG APPFARIAAD VERRIGPVRL EILVQRRLDD GGQPLNGAQK LVRIDKRPAR 
AIDLIGQLRV VLFTPTDVML VDGPPAERRR YLDITLSQLD PHYVRTLAYY QKILLQRNSL 
LRAWREQRRL PRNVDAELGY WDQELAAAGG YLLAERLRAV VELSALAGSI YRKISGGEHE 
LQIEYIASCD LDAARDAGSL AERLRLAFAA QRTDELARGQ TLCGPHRDDL VFNVAGVNLG 
RYGSRGQQRT IALALKIGEA ELMQQRGGDA PVLLLDDVLS ELDNRRRMHL LDLILRPQQQ 
TLLTATNLSD FSADFLAAAR RFRVEDGQLF AG