Gene Dshi_1643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_1643
Symbol	recA
ID	5713208
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	1704693
End bp	1705760
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	59%
IMG OID	641267559
Product	recombinase A
Protein accession	YP_001532986
Protein GI	159044192
COG category	[L] Replication, recombination and repair
COG ID	[COG0468] RecA/RadA recombinase
TIGRFAM ID	[TIGR02012] protein RecA

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.883064
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.00000000000602005
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGCCAGCG CGAGTCTTTT GGACGTGACC AACAATCGTA ACGCAGACAA GCAGAAAGCT 
CTCGACAGCG CCTTGGCGCA GATCGAGCGG CAATTCGGCA AGGGCTCCAT CATGAAGCTC 
GGCGCCGACA GTCCCGTGGC TGAGATCGAA GCGACCTCGA CCGGGTCGAT CGGATTGGAT 
ATCGCGCTCG GAATCGGGGG TATTCCCAAG GGCCGCATCA TCGAGATCTA CGGCCCTGAA 
AGTTCCGGCA AGACCACGCT GACCCTGCAC TGCATTGCCG AAGAGCAGAA AAAGGGTGGT 
GTCTGCGCGT TTGTGGACGC AGAGCACGCG CTGGACCCAC AATACGCCCG GAAACTTGGT 
GTAGATCTGG ACGAGTTGCT GATTTCTCAG CCCGATACCG GCGAGCAGGC TCTCGAGATT 
ACGGAGACTC TCGTCAGGTC CGGGGCGGTC AGCATGGTGG TCGTCGACTC GGTGGCTGCG 
CTTACCCCGA AATCCGAGCT CGAAGGCGAT ATGGGGGATG CCCAAGTCGG CGCCCAGGCG 
CGCCTCATGA GTCAGGCCAT GCGCAAACTG ACCGGCGCGA TATCGCGATC CAACTGCACG 
GTGATCTTCA TCAACCAGAT CCGCATGAAG ATCGGTGTGA TGTTCGGCTC ACCCGAAACC 
ACGTCGGGCG GCAACGCGCT GAAGTTCTAT TCGTCTGTCC GGCTCGACAT CCGCCGCATT 
GGATCGGTCA AGGATCGCGA CGAAATCGTC GGGAACACCA CGAAGGTCAA GGTCGTGAAG 
AACAAGGTGG CCCCGCCTTT CAAACAGGTT GAGTTCGACA TCATCTACGG GGAAGGCATC 
TCCAAAATGG GCGAGTTGAT CGATCTCGGC GTGAAGGCTG GCGTCGTGCA GAAATCGGGG 
TCTTGGTTCT CTTATGGAGA CGAGAGGATC GGTCAGGGAC GGGAGAACGC AAAGCAGTAT 
CTCCGCGACA ACACGAGGAC GGCGCTTGAG CTCGAGGACA AGATCCGCGC AGCGCACGGG 
CTGGATTTCC AGATGCCCGA CAGCGAGGCC GAGATCCTCG ACGACTGA

Protein sequence

MASASLLDVT NNRNADKQKA LDSALAQIER QFGKGSIMKL GADSPVAEIE ATSTGSIGLD 
IALGIGGIPK GRIIEIYGPE SSGKTTLTLH CIAEEQKKGG VCAFVDAEHA LDPQYARKLG 
VDLDELLISQ PDTGEQALEI TETLVRSGAV SMVVVDSVAA LTPKSELEGD MGDAQVGAQA 
RLMSQAMRKL TGAISRSNCT VIFINQIRMK IGVMFGSPET TSGGNALKFY SSVRLDIRRI 
GSVKDRDEIV GNTTKVKVVK NKVAPPFKQV EFDIIYGEGI SKMGELIDLG VKAGVVQKSG 
SWFSYGDERI GQGRENAKQY LRDNTRTALE LEDKIRAAHG LDFQMPDSEA EILDD