Gene Cag_0003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0003
Symbol
ID	3747796
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	3251
End bp	4345
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	39%
IMG OID	637772526
Product	RecF protein
Protein accession	YP_378325
Protein GI	78187987
COG category	[L] Replication, recombination and repair
COG ID	[COG1195] Recombinational DNA repair ATPase (RecF pathway)
TIGRFAM ID	[TIGR00611] recF protein

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.056932
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAATTGC AACGAACCAT TTTTTCTGGA TTTCGGAATC ATACCTCGTT GCTTTTTGAA 
CCATCTGAGG GTGTAACCAT TATTTATGGA GCAAATGGTT CAGGTAAAAC ATCACTGCTT 
GAAGGCATTC ATTACGGCGC ACTAACAAAA GGACTCCTTG GTGCGCCTGA TAGTGAATGC 
CTTTCGTTTG ATACTGAGGC TTTTACCCTT GATTCTCATT TTTTATCGGA TAGTAATATT 
CCGATTCATG TACTTGTAAC GTATCAGCTT GAAGGTGAAA AGCAAGTTAT TGTGGATCGT 
CAAGAGGTAA AACCCTTTTC ATCACATATA GGACGTATTC CCACTATCAC TTTTTCACCG 
TATGAAATAT CTTTAGTAAG TGGTCCTCCT GCTGAACGTC GTCGCTTTTT AGATAGTGCT 
ATTAGCCAAT TAGATCATCG TTATTTAGAT CGTCTGATTA CTTATCGTCG TATTTTACAG 
CAGCGAAATG CGTTACTTGC GCAACTATCC TCTGGTGAAA AAAGTAATCG TAACACCTTA 
CCTTTATGGA CAACACAACT TGCTGAATTA AGCGCATGGC TTGTAGAACG CCGCTTACTC 
TTTCTTACCT CATTTTCTCC CTACTTCCAA CACTATTATC GTTACATTAT TAAGGGTGAA 
GAGCCATCAA TAAATTACCG TTGTACCTCT TGCCCTCTCC ATGGTAATAC TACCTTTCAA 
GAGCTGTATC AGCTTTTTCT ACAACGATAT TCTGATATTG AAGCACAAGA AATTCAACGA 
GGGCAAACAC TTTTTGGAGC ACATCGTGAT GATGTTCTCT TTTTTTTAAA TGAAAAAGAG 
ATTAAGCGTT ATGCTTCACA AGGGCAGTTA CGAAGCTTTT TAATCGCGTT AAAAATCAGC 
CAAGCACATC TTTTTGCTGA TCACTTACAT GAACAACCGA TGTGCTTGTT TGATGATTTA 
TTTAGCGAGT TAGATGGAGG GCGTATTGAG CAAATTCTTG CTTTATTAAA AGAGTGTGGA 
CAAACAATTA TTACAGCGGT TGAACCACGT TATACGGAAG GAATTACACT CTGTGATATT 
CAAGCGTTGA GGTAA

Protein sequence

MKLQRTIFSG FRNHTSLLFE PSEGVTIIYG ANGSGKTSLL EGIHYGALTK GLLGAPDSEC 
LSFDTEAFTL DSHFLSDSNI PIHVLVTYQL EGEKQVIVDR QEVKPFSSHI GRIPTITFSP 
YEISLVSGPP AERRRFLDSA ISQLDHRYLD RLITYRRILQ QRNALLAQLS SGEKSNRNTL 
PLWTTQLAEL SAWLVERRLL FLTSFSPYFQ HYYRYIIKGE EPSINYRCTS CPLHGNTTFQ 
ELYQLFLQRY SDIEAQEIQR GQTLFGAHRD DVLFFLNEKE IKRYASQGQL RSFLIALKIS 
QAHLFADHLH EQPMCLFDDL FSELDGGRIE QILALLKECG QTIITAVEPR YTEGITLCDI 
QALR