Gene Clim_2297 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2297
Symbol
ID	6355642
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	2529945
End bp	2531006
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	55%
IMG OID	642669888
Product	putative DNA-binding/iron metalloprotein/AP endonuclease
Protein accession	YP_001944299
Protein GI	189347770
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0533] Metal-dependent proteases with possible chaperone activity
TIGRFAM ID	[TIGR00329] metallohydrolase, glycoprotease/Kae1 family

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0294499
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATATTT TAGGAATAGA AACCAGCTGC GATGAAACAT CGGCAGCGGT ACTGCTCGAC 
GGCAGAATCG GTTCAAACGT TATCAGTTCA CAGCGCTGTC ATACCAGCTT CGGAGGAGTC 
GTTCCGGAAC TTGCATCGAG AGAACACGAA CGGACAATAG TGTCCATTGT CAACAGCGCG 
GTAACTGAAG CCAATATAAC GAAAAATGAA CTCGATTGCA TAGCCGCCAC CGCCGGCCCG 
GGTCTTATCG GCGCGGTTAT GGTAGGACTC TGCTTCGCCG AAGGCATGGC GTTCGCTCTC 
GGCATTCCGT TCGTTCCGGT GAACCATATC GAGGCGCATA TGTTTTCGGC CTTCATTCCC 
GAATCGCCGG AACACAAGTC TCCTGAAGGC CCCTTTATCT CGCTGACCGT ATCCGGAGGC 
CATACGCTTC TTTCGCTTGT CCGCGAAGAT CTCTCCTATG ACGTGATCGG AAAAACGCTC 
GATGACGCCG CAGGGGAGGC TTTCGATAAA ACCGGCAAGA TGCTCGGCCT CGCATATCCC 
GCGGGGCCGG TTATCGACCG CCTTGCGGCA TCGGGGAATC CTCACTTCCA TGCTTTTCCC 
AAAGCCCTGA CGTCGAGTTC GCAAACCAGC AGAAGCTATC GGGGCAACTT CGATTTCAGC 
TTTTCGGGCC TGAAAACCTC GGTGCTGACC TGGCTGCAGA AGCACCCGGC AGAGTTCATA 
CAAACCCATC TGCATGATAT CGCCGCATCG ATACAATACG CCATTGTAAG CGTTCTGACA 
GAAAAAGCCG TTGCGGCTGC GCGGTATTTC CGTACCGACG CCATCTCCGT AGCCGGAGGG 
GTCAGCGCCA ATTCGGCATT GAGAACGGCG ATGCAGGAAG CCTGTCGGCA CCACGGTATC 
CGATTGTATA TACCCGGCAC GGTATATTCG ACCGACAATG CCGCCATGAT AGCCTCGCTT 
GCCGGTCTCA TGCTCTCGAA AGGCGCCGTG CGGAAAAACA ATTATGACGT CGCTCCATTC 
GCAAGCTTTG CCGCGGGAGC GATCAAGGCA TCATTGAAAT AA

Protein sequence

MNILGIETSC DETSAAVLLD GRIGSNVISS QRCHTSFGGV VPELASREHE RTIVSIVNSA 
VTEANITKNE LDCIAATAGP GLIGAVMVGL CFAEGMAFAL GIPFVPVNHI EAHMFSAFIP 
ESPEHKSPEG PFISLTVSGG HTLLSLVRED LSYDVIGKTL DDAAGEAFDK TGKMLGLAYP 
AGPVIDRLAA SGNPHFHAFP KALTSSSQTS RSYRGNFDFS FSGLKTSVLT WLQKHPAEFI 
QTHLHDIAAS IQYAIVSVLT EKAVAAARYF RTDAISVAGG VSANSALRTA MQEACRHHGI 
RLYIPGTVYS TDNAAMIASL AGLMLSKGAV RKNNYDVAPF ASFAAGAIKA SLK