Gene Clim_0073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0073
Symbol
ID	6355596
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	78710
End bp	79903
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	60%
IMG OID	642667696
Product	putative transcriptional regulator, GntR family
Protein accession	YP_001942158
Protein GI	189345629
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAAGAT TTTCGCAATC AGTATCAGCG CTTCGCTCCT CGGCAATCAG GGAGCTTATG 
AGCCTCGCAT CAAGGCCCGA CATCATCTCC TTTGCCGGCG GCATGCCGGG CAACGATCTC 
TTTCCGGTCG AAGAGGTCGA GGAGCTGTTC CAGAACCTCG ACCCAAAAAC CAAACAGACG 
GCATTCCAGT ACGGCCCGAC CCCCGGCCTG CCGTCGCTGC TCGAATCGCT CTCCGGCTAC 
CTCGAACGAA AAGGGCTGCC CGTACAGAAA AACCGGCTCA TGATCACCAC CGGCTCCCAG 
CAGGCGCTCA GCATCCTCGC ACGGGCATTC ATCGACCCCG GCGACCAGGT GCTCAGCGAG 
TACCCCTGCT TCATCGGAGC GATAGCGGCC TTCAAGGCAT GCGGAGCCGA TATCGTCTCC 
ATTCCGGTCG ATGAGGAAGG CATCGACATC GGCATGCTGC GGCATGAAGC AGGACGCCCT 
TCGCCCGCAA AATTACTCTA CCTAACGCCC TACTTCCACA ACCCGGCAGG GATGCTCTAT 
ACAACCCGTC GCAAACGCCA GCTCATCGAG GTCATGCAGG GACGCGACAT CCCCATCATC 
GAAGACGACG CCTACGGCGA CCTCTGGTTC AGCGAAGAAG ATCGCGAACG GCTGCAGCCC 
CTCAAATCGA TCGACCCCGA AGGCATCGAC CTCTGCTATA CCGGATCGTT CTCCAAAATC 
CTCGGCCCCG GCCTCCGTCT CGGCTGGCTG CTCGCCCCCG AAGCCATCCA CGAAAAATGC 
GAACTGATCA AGCAGTCCGC CGACGCCTGC TCGCCGAGCT TCACCCAGGT CATCGCCGAC 
GCCTTCATCC GCTCGGGCAG AATAGACAGC TACATAGCCT CCGTACGCAA CGAGTACCGC 
TGCCGGGCGG CCTGCATGAC CGCAGCGCTC GGAAGCCTTC TGCCGGACTA TGTGCAATGG 
AACGAACCGA AAGGAGGATT CTACATCTGG CTCACCCTTC CCGAAGGAGC GGACGCCACG 
GAAATTCTCA AACACGCCAT CGAAGGCGGA GCCGTCTTCG TCGCCGGCAG CACTTTCGAC 
CCCGAAGGCC GACGCAACAA CGCCATCAGG CTCTCCTACT GCAACAACAC CCCGGAAGAG 
ATCGAGCGGG GCATTCCGAT CGTTGCAAGG GCGATCAGGG AAGTTTGCGG ATGA

Protein sequence

MPRFSQSVSA LRSSAIRELM SLASRPDIIS FAGGMPGNDL FPVEEVEELF QNLDPKTKQT 
AFQYGPTPGL PSLLESLSGY LERKGLPVQK NRLMITTGSQ QALSILARAF IDPGDQVLSE 
YPCFIGAIAA FKACGADIVS IPVDEEGIDI GMLRHEAGRP SPAKLLYLTP YFHNPAGMLY 
TTRRKRQLIE VMQGRDIPII EDDAYGDLWF SEEDRERLQP LKSIDPEGID LCYTGSFSKI 
LGPGLRLGWL LAPEAIHEKC ELIKQSADAC SPSFTQVIAD AFIRSGRIDS YIASVRNEYR 
CRAACMTAAL GSLLPDYVQW NEPKGGFYIW LTLPEGADAT EILKHAIEGG AVFVAGSTFD 
PEGRRNNAIR LSYCNNTPEE IERGIPIVAR AIREVCG