Gene Caul_1392 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1392
Symbol	recA
ID	5898847
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	1480838
End bp	1481908
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	64%
IMG OID	641561879
Product	recombinase A
Protein accession	YP_001683020
Protein GI	167645357
COG category	[L] Replication, recombination and repair
COG ID	[COG0468] RecA/RadA recombinase
TIGRFAM ID	[TIGR02012] protein RecA

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.344472
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAATC AGGCGGCTTT GAAACTCGTG GGCAAAGAAG ACGGCGACAA GCAGCGCGCG 
CTCGAAGCGG CGCTGGCGCA GATCGACCGG GCGTTCGGCA AGGGCTCGGT GATGAAGCTG 
GGCGAAAAGG GCAAGGTCGA GATGGAGTCG ATCTCCACCG GCTCGCTCGG CCTGGACATC 
GCCCTGGGCA TCGGCGGCCT GCCCAAGGGG CGGGTGATCG AGATCTACGG TCCGGAAAGC 
TCGGGCAAGA CCACCCTGGC CCTGCACGTG GTGGCGGAAT GTCAGAAGGC CGGCGGCACG 
GCCGCCTTCG TCGACGCCGA GCACGCCCTG GATCCGGGCT ATGCCTTCAA GCTGGGCGTC 
AACCTCGACA ACCTGCTGGT CTCGCAGCCC GACAACGGCG AACAGGCCCT CGAGATCACC 
GACACCCTGG TGCGCTCGGG CGCCGTGGAT ATCGTGGTCA TCGACTCGGT CGCGGCCCTC 
ACGCCGAAGG CGGAAATCGA AGGCGAGATG GGCGACAGCC TGCCGGGCCT GCAAGCCCGC 
CTGATGAGCC AGGCGCTGCG CAAGCTGACC GCCTCGATCA ACAAGGCCAA CACCATCGTC 
ATCTTCATCA ACCAGATCCG TCACAAGATC GGGGTGATGT ACGGCAGCCC GGAAACCACC 
ACCGGCGGCA ACGCCCTGAA GTTCTACGCT TCGGTCCGCC TGGATATCCG CCGCACCGGT 
TCGATCAAGA ACCGCGACGA GATCGTCGGC AACAACGTCC GGGTCAAGGT GGTCAAGAAC 
AAGGTGGCCC CGCCGTTCCG CGAGGTCGAG TTCGATATCA TGTATGGCGA GGGCATCTCC 
AAGCTGGGCG AGATCATCGA TCTGGGCGTC AAGGCCGGGA TCATCGACAA GGCCGGCTCG 
TGGTTCTCCT ACAACAGCCA GCGCATCGGT CAGGGCCGCG ACAATGTTCG TGAGTTCCTG 
AAGGTCAACA AGGATCTGGC CGCCGAGATC GAGGCCGCCG TGCGCAAGTC CTCCCAGAAG 
ATCGAGGAAG AACTGCTGGT CGGCGGCCCT GAGGACGGCG ACGACGAATA G

Protein sequence

MSNQAALKLV GKEDGDKQRA LEAALAQIDR AFGKGSVMKL GEKGKVEMES ISTGSLGLDI 
ALGIGGLPKG RVIEIYGPES SGKTTLALHV VAECQKAGGT AAFVDAEHAL DPGYAFKLGV 
NLDNLLVSQP DNGEQALEIT DTLVRSGAVD IVVIDSVAAL TPKAEIEGEM GDSLPGLQAR 
LMSQALRKLT ASINKANTIV IFINQIRHKI GVMYGSPETT TGGNALKFYA SVRLDIRRTG 
SIKNRDEIVG NNVRVKVVKN KVAPPFREVE FDIMYGEGIS KLGEIIDLGV KAGIIDKAGS 
WFSYNSQRIG QGRDNVREFL KVNKDLAAEI EAAVRKSSQK IEEELLVGGP EDGDDE