Gene Clim_0441 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0441
Symbol
ID	6354436
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	492171
End bp	493559
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	36%
IMG OID	642668072
Product	CRISPR-associated CXXC_CXXC protein Cst1
Protein accession	YP_001942513
Protein GI	189345984
COG category
COG ID
TIGRFAM ID	[TIGR01908] CRISPR-associated CXXC_CXXC protein Cst1

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAGTT TATTTCAATA CACAGGAAAT CCTTTTGTGG ATGCGGGGAT TTCTGCACTC 
ACAAACTGGT GTGATAAAAA AACACCGCAA GAGCTAACTG AAGCGGATAT TAAAAAAGCC 
TTGCCTGAAA TCGCTAATCT TTTTTCTCAA GGGGCATGGG TTAAAACTTT TTATACCACC 
TTTTCTAACG GGGTGATGGT ACAGCCTTCA AATAAAGGGA AAGAAAGAGA AAAATGGTTG 
GAGTTTATAG GTGATCTTGT AAAAGAATTA CAACCATTAG CTGACCATGG TTCTTGCGTT 
GCTTGTGGAT GTCGAAATGC TATAAAAATT AAGAAAGAAA AAAGAGGACT GTTGAGAAGT 
GAAGTCCCTA TGGCAAGCGG CTCACTTAAT TATTACTCTT TTGCTTCTAC TGGAGCCGAT 
TATTGTGGGA CTTGTGCAAT TGCAATTCAA GTTTCACCTT TGGTTCTCTA TCGAAGTGGT 
GGAAAGATGA TTTTGGTGCA TTCTAGCTCA GAGAAAGCTA TGTGCTCATG GGCAAAAATG 
GCAATAAATG AAGTTCGATC TCAAATTAGC CTTAGGAATT ATACGGGATG TTTTACCGAA 
AATTTTACAA ATCCACAAAA CGCCTTATTT CGTATTGCTA AAATACTCAT TCAGGATAAG 
GATGATTGGA AGAGTGATCC GATTACTATT CGTATTTATT ATTTCACCAA CTATGGACAA 
GGCGCAGAAT TGAAATACTA TGATTTGCCT AACCGGGTTT TTCATTTTTT AAATGAAGTT 
CACCATAGTG AAGAATTGAA AGATTGGGAT AAAATTATCG GAAGTACATA CTTTTTTAAA 
AAAAATAACT CTAAAATTTA TTTGAATACT GATGATAAAT CCGAGGAAGA ATACAAAAAT 
AATAACAACG TTATTTATGA AGGCTTGTTG AAAGATGAGT GGATTGTTAA ATATTTTTAC 
AACTTTCTGC AACGCAAGGC CTATGCGAAG TGGGAGCTTG TTCAACTGTA TTTAAAGGAG 
GTTAGACAAA TGGATAAACA AAGAACAGAA GTGATTAAAA GGGTGGCTGA TGAAATATCA 
TTAGTGATTC AAAGAGACGA ATCACATAAT CCAAAACGTC TGTGGCAGCT TGAGCGAGCA 
AACAGCTATG GCACTTTTCG CAACGTTCTA CGCCTAATAA TAAAGGATCG TATTAAAAAT 
GGTGCCGAGC GTCCGTTGTT CAGTATTGAA GATTATACAG AGAGACTTTT TCCTGATGGA 
GCGCTTTGTT GGCGGGAAAC TCAAGACCTT ATTCTCTTTC GCTTGTACGA GATGCTACAT 
GGCTGGTTAA AAGAAAGAGA TATTGTAATA GATGAAGTTG AAGAAAACAG TACAACTGAA 
ATTGAATAA

Protein sequence

MSSLFQYTGN PFVDAGISAL TNWCDKKTPQ ELTEADIKKA LPEIANLFSQ GAWVKTFYTT 
FSNGVMVQPS NKGKEREKWL EFIGDLVKEL QPLADHGSCV ACGCRNAIKI KKEKRGLLRS 
EVPMASGSLN YYSFASTGAD YCGTCAIAIQ VSPLVLYRSG GKMILVHSSS EKAMCSWAKM 
AINEVRSQIS LRNYTGCFTE NFTNPQNALF RIAKILIQDK DDWKSDPITI RIYYFTNYGQ 
GAELKYYDLP NRVFHFLNEV HHSEELKDWD KIIGSTYFFK KNNSKIYLNT DDKSEEEYKN 
NNNVIYEGLL KDEWIVKYFY NFLQRKAYAK WELVQLYLKE VRQMDKQRTE VIKRVADEIS 
LVIQRDESHN PKRLWQLERA NSYGTFRNVL RLIIKDRIKN GAERPLFSIE DYTERLFPDG 
ALCWRETQDL ILFRLYEMLH GWLKERDIVI DEVEENSTTE IE