Gene Clim_0623 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0623
Symbol
ID	6354071
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	702236
End bp	703942
Gene Length	1707 bp
Protein Length	568 aa
Translation table	11
GC content	54%
IMG OID	642668254
Product	DNA repair protein RecN
Protein accession	YP_001942689
Protein GI	189346160
COG category	[L] Replication, recombination and repair
COG ID	[COG0497] ATPase involved in DNA repair
TIGRFAM ID	[TIGR00634] DNA repair protein RecN

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.72171
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCAGCA GCCTTTACAT CAGAAACTTT GCCCTGATAC GAGAACTTAC CGTAGAGTTT 
TCCAGAGGCC TCTGCATCAT TACCGGCGAA ACCGGTGCCG GCAAATCGAT GCTTATCGGA 
GCACTCAGCC TTGTGCTTGG AGAACGCTCC AGCAGCGACC TTGTCCGTTC AGGCGAAAAC 
AAGGCCATTA TCGAAGCCAT GCTCTGCGGT CAGCTCCCTG AGCGGCTCGG TGCCCTGCTC 
GAAGAGGCGG GAATTGAATG CACGAACGAC ACTCTTCTGC GCAGGGAAAT TTCCGTTTCG 
GGGCAGTCAC GCTGTTTTAT CAATGACACA CCCTGCACGG CGGGAGTGCT GAAACAGGTC 
GGAGAACTGC TCATAGACCT GCACGGTCAG CACGACCATC AGCTCCTGCT CAATGCGGCG 
TCCCATGAGG GCATGCTCGA TGCATTTTCC GGATGTGCAT CGGAAAGCTC CGCTTACCGT 
GATACGGTTT CCCGCCTCTC TTCACTCTAC CGGCGAAAGA GCGTGCTTGC CCTTCAGGCA 
GCGGAAGCAA AAGAAAAAAA AGAGATGATG CAGTTCCAGT TCAACGAACT GAATGCCCTT 
GACCTGAAAA ACGGTGAAGA GGAGGAACTG GAGAGTGAAA TAATCCTGCT CGAAAATGCA 
GAAACGCTCT ACGGGCTTGG TTCGGAACTC GGGAATCTCC TCTACGAACA GGATCATTCG 
GCATATGCAG CGCTCTCATC AGCCCGGCAT ATTCTGGAAA AACTTTCCGC CATAGACAAA 
CGGTTCGAAA GCCGCCTTGA AGACGTCCTC TCGGCGGAAA ACATGGTTGA CGATCTCTAT 
CGTTTTGTAA ACCGTTACAC TGCGGCCGTC GAATTCAACA GCGACCGGCT CGATACCATG 
AGAACCCGTC AGCATCTGCT GCAGCGCACC CGAAAAAAAT ACGCCAAAAC CCTGTCCGAA 
CTGATTTCCT GGAGAGATGA ACTGACCGCC GCCCTTGGCA TTGAAGAGTC GATTGCCGAA 
GAAAATTCTC TTATCGACAC GGAGATCGGT TCGCTCCGGG AAAAACTCTC CGCTGCGGCG 
GCATCCCTGT CTCAAAAACG GAAAAACGCG GCACGCCGAC TCGATGAAAC GCTGCAGCGG 
GAGCTCTCGA TGCTCGGCAT TGCCAGCGCA CGGTTCAAAA CGGCTTTTAC GCCCGAAGAG 
GATCCGGAAG GCGACATAAC GCTCGATGGA ATCCGCTACA AGGCTCTTGC GAACGGACAT 
GAAAAGATCG AGTTCCTGTT TTCAGCCAAC ACCGGAGAAG AACTGAAACC ATTGGCAAGG 
TCTGCCTCCG GAGGAGAAAT TTCCCGGGTA ATGCTCGCCC TGAAGAGCGC GCTTGCAGAA 
TCTGCGGCAC TCCCTATTCT TGTATTTGAT GAAATCGATA CCGGCATCAG CGGCACAACG 
GCCCTTGCCG TAGCATCCAG CCTCAAAAGG CTTTCGCGTC TGCATCAGAT CATCGCGATC 
ACCCATCTCC CGCAGATTGC CGCCATGGCC GATCTGCACC TTTCGATCAG TAAAACGATC 
GAAAACGGGA GAACCTCTGC CGGTGTGCTG CATCTTGATG AACCGGGACA CATCCGGGCC 
GTTGCCGAAC TCATCAGCGG AAGAAACGTA TCCGAATCCT CCCTCAGACT TGCCGGTGAA 
CTGATAGAGA GCGCAAAATC AATTTAG

Protein sequence

MLSSLYIRNF ALIRELTVEF SRGLCIITGE TGAGKSMLIG ALSLVLGERS SSDLVRSGEN 
KAIIEAMLCG QLPERLGALL EEAGIECTND TLLRREISVS GQSRCFINDT PCTAGVLKQV 
GELLIDLHGQ HDHQLLLNAA SHEGMLDAFS GCASESSAYR DTVSRLSSLY RRKSVLALQA 
AEAKEKKEMM QFQFNELNAL DLKNGEEEEL ESEIILLENA ETLYGLGSEL GNLLYEQDHS 
AYAALSSARH ILEKLSAIDK RFESRLEDVL SAENMVDDLY RFVNRYTAAV EFNSDRLDTM 
RTRQHLLQRT RKKYAKTLSE LISWRDELTA ALGIEESIAE ENSLIDTEIG SLREKLSAAA 
ASLSQKRKNA ARRLDETLQR ELSMLGIASA RFKTAFTPEE DPEGDITLDG IRYKALANGH 
EKIEFLFSAN TGEELKPLAR SASGGEISRV MLALKSALAE SAALPILVFD EIDTGISGTT 
ALAVASSLKR LSRLHQIIAI THLPQIAAMA DLHLSISKTI ENGRTSAGVL HLDEPGHIRA 
VAELISGRNV SESSLRLAGE LIESAKSI