Gene Clim_2126 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2126
Symbol
ID	6355920
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	2345665
End bp	2347038
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	51%
IMG OID	642669717
Product	Pyridoxal-5'-phosphate-dependent protein beta subunit
Protein accession	YP_001944129
Protein GI	189347600
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG0031] Cysteine synthase [COG3620] Predicted transcriptional regulator with C-terminal CBS domains
TIGRFAM ID	[TIGR01137] cystathionine beta-synthase

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGAATC ACGATATTTT CGGAATTTCA ACCGAAACTC CACTTGTATA TATCGGGCAG 
ATGGCCCGGT ATCTTAAAGC AAAGGTCATG GCCAAGCTGG AGTATATGAA CCCTGCCTGC 
TCGCACTACT ACCGTGCGGC TTCGGCGGTA ATCCGCGATG CGGAGGAGCG GAAGCTGATC 
CATCCCGGCA TGACTCTCGT TGACTGGACC TACGGCAACA GTGGTATTGC GCTTGCAATG 
GCAGGAGTAA GTCGGGGATA CAAGCTGCTT CTGGCCGCTC CTGACAAAAT TTCGAACGAA 
AAAAAAGATG TGCTCAAGGC GCTTGGCGCC GAAATAGTGA TCACCCCTTC GGATGCGCTG 
CCTGAAGAAC CGAGAAGCTG CATGAAGGTT GCGGAAAGTC TGGTAAGAAA CATTCCCAAC 
GCTTTTTTTG CCAATTTATA CGAAAATCCT GTGAGCAGGG ATGTCCATTC GAATTCAACC 
GGCCGGGAGA TTCTGCAACA GACGGAAAGC CGGGTAACGC ATGTTTTTGT CCCCATGATT 
TCCGGGGCCA TGATTTCCGG AATCGGGCAC CTGCTCAAGG CCGAAAAACC TTCGATCAGA 
ATAATCGGCG TAGAACCGGA GGGTTCCATA TACCAGAGCC TTTTCAGAAA AGGGGTTCAG 
GATAAACCTG CAGCATATGA ACTCGAGGAG ATCGGCGCGC TGCAGCCGTC GGGATTCTGG 
GACCCGTCGG TTATCGACGA TATTGTCCAG GTCAGCGATA ATGATGCATT CAACTGCGGA 
AGGGAGCTTC TGCGGGCTGA AGCTATCTTT GCGGGAGGAG CATCCGGAGC GGTTATGGCT 
GCCGCACTCC ACTCTGCTGC CGCTTACGGC GAGAACGATT GCATCGTTGC CGTACTGAAC 
GATTTCGGCG GCTACTATCT CAGTAAAATG TTCCGTGACG GCTGGATGAA ACAGAAAGGA 
TACTATCGTA AGGCAAAAAC CGCTCTCGAA CAGATTACAG CCGAAGACAT CCTGCAGCTA 
AAGGCGCGAA AGGATCTCAT TTTCGCCAAT CCGGAAGCCA CGCTTGCCGA AGTCTTCGAG 
ATGATGAAGC AGAACGACGT ATCGCAGCTT CCCATCGTTT CCTATGGCAC CCCTATCGGC 
AGCATCAGCG AAAACAAGAT TCTGTCAATT CTGATCGAAA ACGATGAAGC CATGAATTCA 
AAAGTTGTGG GATTCATGGA ACCGCCCTTT CCGGTCTGTC AGACGGATGC AACCATTTCG 
GAACTGTCGG ACAAGCTGCA GCAGAGTGCT TCAGGAATAC TTATCAGCCT TTCGGACGGA 
AGGCTCCAAC TGCTTACAAA ATCAGATCTT ATCGATGCTC TGACGCATAA ATAG

Protein sequence

MSNHDIFGIS TETPLVYIGQ MARYLKAKVM AKLEYMNPAC SHYYRAASAV IRDAEERKLI 
HPGMTLVDWT YGNSGIALAM AGVSRGYKLL LAAPDKISNE KKDVLKALGA EIVITPSDAL 
PEEPRSCMKV AESLVRNIPN AFFANLYENP VSRDVHSNST GREILQQTES RVTHVFVPMI 
SGAMISGIGH LLKAEKPSIR IIGVEPEGSI YQSLFRKGVQ DKPAAYELEE IGALQPSGFW 
DPSVIDDIVQ VSDNDAFNCG RELLRAEAIF AGGASGAVMA AALHSAAAYG ENDCIVAVLN 
DFGGYYLSKM FRDGWMKQKG YYRKAKTALE QITAEDILQL KARKDLIFAN PEATLAEVFE 
MMKQNDVSQL PIVSYGTPIG SISENKILSI LIENDEAMNS KVVGFMEPPF PVCQTDATIS 
ELSDKLQQSA SGILISLSDG RLQLLTKSDL IDALTHK