Gene Clim_0240 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0240
Symbol
ID	6354696
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	267975
End bp	269543
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	53%
IMG OID	642667868
Product	transposase IS4 family protein
Protein accession	YP_001942314
Protein GI	189345785
COG category	[L] Replication, recombination and repair
COG ID	[COG5421] Transposase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.995289
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCATATC GGGTTCACCA GCTCAACAAG AAGACCGGAG TCACCTATGT TTACGAGGCG 
GTCTCTACCT GGGACAAAAC GCTCAAGCAG GCCAGAAACA AACAGATCTG CGTCGGCAAG 
ATCGATCCGG TGACCGGTGA GTTTGTGCCG TCAAAACGGC TTGATCCTGC CCAAAGTGCG 
CTTCGCGATC CAGCTGTGAC CGCTTCGGCT CAGGTGATGG GTCCAACCTT CGTGCTCGAT 
GCGATTGCCC TGCGTACAGG GGTGAGCGCG CTCATGAAAT CAGTATTTCC GCAGTCGCAT 
CAGGAGCTCA TGGCCATGGC ATTCTATTTG ACCAGCCAAG GGGGCGCATT GAGCCTTTGC 
GCCTCATGGG CCAAGGGCCA TATGCCTGAC CTTGCGGCAT CACTTGGCAG CCAGCGCATG 
AGCGATTTGC TTGCCTCAAT CGGAACCGAC CGGAAGCAGG CCTTCTTTGC CAAGTGGATG 
AAGATGCGTC TGGAGAACGA TTACCTGTGC TATGATATCA CCTCGGTCTC CTCATATTCG 
GAGCTGAACG AGTATATCAA GTACGGCTAC AATCGTGATG AAGAGAAGTT GCCACAACTG 
AACCTGGCCA TGTTGTTTGG ACAGAAGTCC GGATTACCGG GCTATTACCA TCGGATTCCT 
GGCAATATCA ATGATGTGTC AACCTTGCAT AACCTTCTGG AGACCTTCAG AATGCTGGAG 
ATCGGGCAAT TGCATTATGT GATGGATAAA GGATTTTACA GCAAGAAGAA TGTCGATGAT 
CTGGTCGGAT ACCGCGACCA TTTCACCATC TCGGTACCGA TAAACAATCG GTGGCTACAG 
CGGGCTATCG ATGACATCCA TCAGACGATT CACGGCCCTG AAGGGTATCG CAGGCTCGAT 
GACGAAATCC TGTATGTGCA CTCACGCTTC TACCCGTGGG GAGAAGCACG GAGACGGTGC 
TACCTGCATC TGTACTACAA CGCCACCAAA CGGGCACGGG AGATCGACAC GTTCAATGAG 
TCGTTGTTCC GGTATCGGGA GGAGCTTGAA TCCGGCAAAC CGATCGCTGC CCACCAGAAG 
GCGTATGAGG ATTTCTTTAC CGTGAAAACG ACACCGAAAC GAGGAACGAT AGTCTCCTTC 
AACACCGAGG CGATCAACCG CCATATCAGC CGGTATGCCG GGTTCCAGGC ACTGCTCTCC 
AGTGACATCA AGGATCCGGT CGAAGCCCTG CGTGTCTATC GTAATAAGGA TTCTGTGGAA 
AAGTGTTTCG ATGACCTGAA AAACACACTC GATATGAAGC GGCTGAGAAT GCACTCCTCA 
GCGACGGTTG ACGGACGACT GTTTATCCAG TTCATCGCCC TGATACTCAT CAGTGCGCTT 
CGCAAGCAGA TGCGGGATTC CGGATTGATC GAGCAGTATA CGGTGCGCGA ACTGCTCAGG 
GAGATGGAGA CGCTCACCAA GATAACCTAT TCCGGAAAGT ACGGGCATAT CCTTACCGAA 
CTGACCAAGC CTCAGCGTCA GATTCTCACT GCTCTCAATA TTCCCGTCCT TGACCCGGCA 
TCGTTATAA

Protein sequence

MAYRVHQLNK KTGVTYVYEA VSTWDKTLKQ ARNKQICVGK IDPVTGEFVP SKRLDPAQSA 
LRDPAVTASA QVMGPTFVLD AIALRTGVSA LMKSVFPQSH QELMAMAFYL TSQGGALSLC 
ASWAKGHMPD LAASLGSQRM SDLLASIGTD RKQAFFAKWM KMRLENDYLC YDITSVSSYS 
ELNEYIKYGY NRDEEKLPQL NLAMLFGQKS GLPGYYHRIP GNINDVSTLH NLLETFRMLE 
IGQLHYVMDK GFYSKKNVDD LVGYRDHFTI SVPINNRWLQ RAIDDIHQTI HGPEGYRRLD 
DEILYVHSRF YPWGEARRRC YLHLYYNATK RAREIDTFNE SLFRYREELE SGKPIAAHQK 
AYEDFFTVKT TPKRGTIVSF NTEAINRHIS RYAGFQALLS SDIKDPVEAL RVYRNKDSVE 
KCFDDLKNTL DMKRLRMHSS ATVDGRLFIQ FIALILISAL RKQMRDSGLI EQYTVRELLR 
EMETLTKITY SGKYGHILTE LTKPQRQILT ALNIPVLDPA SL