Gene Clim_2069 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2069
Symbol
ID	6355047
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	2280937
End bp	2282619
Gene Length	1683 bp
Protein Length	560 aa
Translation table	11
GC content	54%
IMG OID	642669665
Product	Peptidoglycan-binding domain 1 protein
Protein accession	YP_001944077
Protein GI	189347548
COG category	[S] Function unknown
COG ID	[COG2989] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.118953
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAGCTT TCGTTTTTCT TCTGCTTTTG CTTGTTTCGG CTCGAGTCGT TCAGGGCGAG 
CCGGTTTCTC TTCAGAATCA GGTTATCGGA AAGAAAACGA CGGCTCGGCA GCATGCGCCC 
GATTCCGTTC TCGCTGCACA GTTGCGTTGC CATTTTCAGG CGATGGACAG CAACGCGGCA 
GGTCCGGAAC GGAGGGCATT CAACAATCAG CTGGCCCGCT TTTATGCCGC ACGGAACTAT 
AGGCCGGTCT GGACGGAACG GGCAGACATT GCCGAACTCA TCGAAGCCAT CGGTGAAAGT 
GAAAACGATG GGTTGATTCC CGATGATTAT CACATCAAAG AGATCCGCAC TTTTTTCCTC 
TCTCCTCCGC GTACTCCTGA ACTGCAGGCG AAGTACGATC TGCTGCTCAG CGATGCATTG 
CTGAGTCTTG CATATCATCT TCGTTTCGGG AAAGTAGATC CGGAAAGCCT TGACCCCAAC 
TGGAATCTTG ACGGCACTGC GCGTCGGACG GCACTTGAAT ACCGGTTGCA GAATGCTCTT 
GCCGCGGGCC GCCCCAAAGC GGCGCTCGAT GAACTTCGAC CGAAGCATTC CGGATACGCC 
GAACTGAAAA AAGGTCTGGC CCGCTACCGG GTTATCGCAC GGGCAGGTGG TTGGCAGAAG 
GTTCCCGAGG GGGATTCTTT CAGGGAAGGA GTCAGAGACA GCCGGGTTCC TCTCCTTCGA 
AAACGGCTTC AGCAGTCCGG AGACCTTCCG GGCGGGGTTA CCGACAGCTC GAAGGTATAC 
ACTGCTGCCA TGGCAAATGC CGTGAAACGG TTTCAGAAAC GCAACGGCCT GTCGGTTGAC 
GGCGTAGCCG GAACGGCGAC AATCGGTGAA ATCAATATTT CAGCAGCTGA GCGTGTCGAT 
CAGATACGCC TTAATCTGGA GCGTTACCGC TGGTTCGTCA ACGATCTCGA GCCAACCTAC 
GTGCTGGTGA ACATTGCCGG CTTCACTCTG CAGTATATAG AGAACGGGCG CTATCGCTGG 
GGAACGCGGG TGATTGTGGG ACAACCCTAT CGAGAGACCC CGGTTTTCAA GGCAGATATG 
CAGTATATCG TCTTCAATCC GCAATGGGTT ATTCCGCCGA CCATTCTTGC CGAGGACGCT 
CTCCCGGCCA TTCGTAACAG CCGCTCCTAT CTTGACAGAA AGAAACTCAG GGTAATCGAT 
TCCAGGGGCA GGGTGGTCGA TCCGGCTTCA GTCAACTGGT CGGGCTATTC GGCAGCCAAC 
TTTCCCTATC GGCTTCAGCA AACAGCCGGT GACCATGGAG CCCTTGGCAG AATCAAGTTC 
ATGATGCCCA ACAAACACGT TATCTATCTT CACGATACGC CGACCAAAAA CCTGTTTGAA 
AAAAGCGAGC GCACCTTCAG TTCCGGTTGT ATAAGGGTTG AAAATCCGCT CGATCTTGCG 
CAGCTTGTGC TGCAGGATTC GGTAAAATGG AACAAAACCA GTATCGACAG CACTATCGGT 
ACGGGAAAAA CAAGCACGGT CAATCTTCCG AAAAGGATAC CGGTTTTTCT TCTCTATCTG 
ACGGCAATCG CCGAAGGTGA GGAGATACAG TTCCGCCGGG ATGTCTATAA CCGAGACGAT 
CGCCTTCGGA AGGCGCTCGA TTCACCGGTA CCGCAATACC GGATCGAAAG CTGCGGACTC 
TGA

Protein sequence

MRAFVFLLLL LVSARVVQGE PVSLQNQVIG KKTTARQHAP DSVLAAQLRC HFQAMDSNAA 
GPERRAFNNQ LARFYAARNY RPVWTERADI AELIEAIGES ENDGLIPDDY HIKEIRTFFL 
SPPRTPELQA KYDLLLSDAL LSLAYHLRFG KVDPESLDPN WNLDGTARRT ALEYRLQNAL 
AAGRPKAALD ELRPKHSGYA ELKKGLARYR VIARAGGWQK VPEGDSFREG VRDSRVPLLR 
KRLQQSGDLP GGVTDSSKVY TAAMANAVKR FQKRNGLSVD GVAGTATIGE INISAAERVD 
QIRLNLERYR WFVNDLEPTY VLVNIAGFTL QYIENGRYRW GTRVIVGQPY RETPVFKADM 
QYIVFNPQWV IPPTILAEDA LPAIRNSRSY LDRKKLRVID SRGRVVDPAS VNWSGYSAAN 
FPYRLQQTAG DHGALGRIKF MMPNKHVIYL HDTPTKNLFE KSERTFSSGC IRVENPLDLA 
QLVLQDSVKW NKTSIDSTIG TGKTSTVNLP KRIPVFLLYL TAIAEGEEIQ FRRDVYNRDD 
RLRKALDSPV PQYRIESCGL