Gene Clim_2361 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2361
Symbol
ID	6355707
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	2590311
End bp	2591663
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	49%
IMG OID	642669953
Product	pentapeptide repeat protein
Protein accession	YP_001944363
Protein GI	189347834
COG category	[S] Function unknown
COG ID	[COG1357] Uncharacterized low-complexity proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAATA AACAGTTACT TTTCCGGGCG ATCCTCCTTT CTGCTTTTTG TATTTCCCCA 
TCAACAGTGT TCGGTTTTGA TCCCGAGGCT GTTACAATAC TGAAAAACAG CCGTGAAGAG 
TGGCAGGCCT TGCGGCGCTC AAATCCCGAA AAAACCATAG ATCTGAACAA GGCAAAGCTC 
GAAGATGCAG ATCTCGAAGG AGCCAACCTC AGCAACGTAT CACTGGTAAG AGCCGAGCTT 
AGTGGTGCAA ATCTCAACAG AGCAAATCTG CAGAAAACAA ATCTTGCCAT GGCATTCATC 
AAAAAAGCAG ACCTGAAGGA AGCCAACTTC AGTGGCGCAT CACTGACGAA AGCCAATCTC 
AAGGAATCCT TCATGAAAGG AGCTTCGTTT TCCAGGGCAA ATCTGCAGGG TGCAAACCTG 
AGATGGTCGA TGCTTGAAAA TGCCGACCTA TCACAGGCAA ATCTTTCCGG AACCGTTCTT 
TTCGAAGCAA ATCTTGAAAA TGCCAATCTG AAAGGGACAA ACTTCAAAGG CTCGGTTTTC 
ATCGACCAGG CAAACCTCAG CGGAGCTCTG GTATCGAACA ATACCATAAT TCCGTCCGGC 
GAAAAAGCGA CTCCGTCCTG GGCATCACTT CGCAAGGCAC GATTTTTCAG GGAGCCCGAT 
ACCGAACCGC CGGCCTATCT GACGCCTCCT GAACCCACCA TGCTGAACGA ACAGGCGTCA 
GCTTCCGGAA GCAACCTGAA AACCAGCGGA CTTAAAGTGA AGACCACTCC GGGCGACAGC 
AGAAAACAAC AGGAACTGCT CACTGAAGAT GTAGAAACAT GGAACAGCAT GAGGGAGAAA 
AATCCTGAAT TGCCAATTAC AATGAAACAG GAAAAACTTG AGAATGCCGA TCTCAAGGGG 
GTAAACCTTT CGCAGGCCTC AATGGCTGGA TCGGATTTTG AAGATGCCAA TCTTGACAAT 
GCACTCATGA ACGGAGCGGA TCTGACCGGC TCGAATTTCC AGAAAGCCGA TATGAAAGCG 
GTTAAACTTC ATGGGGCCAA ACTCCACAAA GCAAACTTCG ACCGAGCCTT TCTGAAAGGA 
TCTGATCTCA GCAATGCCGA TCTGACACAG GCTAATCTCT ACGGCGCAAT CATGACCGGA 
ACGAATCTGA GCGGTGCCGA TCTGACCGGA GCGTCACTTT TCGATACTGA TCTTGAGGAA 
GCCGACCTGT CGGGTGCAAT TCTGAAAGAT GTCACCATGA TGGATACAAA CCTGAACAAT 
GCCATCATCA CCTCTGAAAC CGTTCTTCCT TCAGGGAAAA AAGCCACTGC TGATTGGGCA 
GTACAGAGAG GAGCTATTTT CCGGAAGCCT TGA

Protein sequence

MSNKQLLFRA ILLSAFCISP STVFGFDPEA VTILKNSREE WQALRRSNPE KTIDLNKAKL 
EDADLEGANL SNVSLVRAEL SGANLNRANL QKTNLAMAFI KKADLKEANF SGASLTKANL 
KESFMKGASF SRANLQGANL RWSMLENADL SQANLSGTVL FEANLENANL KGTNFKGSVF 
IDQANLSGAL VSNNTIIPSG EKATPSWASL RKARFFREPD TEPPAYLTPP EPTMLNEQAS 
ASGSNLKTSG LKVKTTPGDS RKQQELLTED VETWNSMREK NPELPITMKQ EKLENADLKG 
VNLSQASMAG SDFEDANLDN ALMNGADLTG SNFQKADMKA VKLHGAKLHK ANFDRAFLKG 
SDLSNADLTQ ANLYGAIMTG TNLSGADLTG ASLFDTDLEE ADLSGAILKD VTMMDTNLNN 
AIITSETVLP SGKKATADWA VQRGAIFRKP