Gene Clim_0785 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0785
Symbol
ID	6353855
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	859087
End bp	860325
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	51%
IMG OID	642668409
Product	putative transcriptional regulator
Protein accession	YP_001942844
Protein GI	189346315
COG category	[K] Transcription
COG ID	[COG2865] Predicted transcriptional regulator containing an HTH domain and an uncharacterized domain shared with the mammalian protein Schlafen
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGTTA GAAATCTGAC GGAAGAACTT TTAGGAAAAG GTGAGTCAGA TCGCATTGAG 
TTTATTGCAT CAGCCCGGGC AGAAAACTCA ATTGGTCGTG CCGTGTGTGC ACTTCTCAAT 
ACCAAAGGCG GCAGCGTTTT AGTCGGTGTC GATGATTGCG GGCAGGTGCT CGGTGTTCTC 
AGAGAAGAGG ATGCTGATGC ACTCCGCTTA TTTTTGCATA GACACATCAC CCCTCAGGTA 
TTGTTCACTG TTACTCTGGA TGATGTTCAG GGAGGCAGGG TCATTACTGT TGATATACCG 
GAAGGCTCTG ACCGACCCTA TGTTTTTGAT GGGGCGGTTT ACATCAAGAA AGGGCTGGAT 
ATCCTGGCGG TCGACGCTGC GACAATGCGC GAGATGGTGG TCCGGCAATC CCGCGAAACC 
GAGAGATGGG AACGTCGCGT CGCTGTCGGT CTTGCCATTG ACGATCTCGA TCGCAAGCTG 
CTGGATGAGA CTGTACGCAA GGCGCAGGAT CGAGGGTATC GGTTTGAAGA GGTTCACAAG 
CCTGATGCCG TGCTTGCGGA TTTGGCTTTG GCTCGGTTCG GTCAATTGAC CAATGCGGCA 
GATGTGTTGT TTGGTAAACG TGTTGCACTG CGCCATCCGC AGACGCGACT GCGGGCGGTT 
TGCTATGAAA CGGATCGCGG AGACAATTTT ATCGATGAAC AGTTGTACGA AGGTCCGGCA 
TTCTATCTGC TGGAAGAAGC GATGGTCTTT CTAAAAAGGC ATGTTGCGAT TGCTGCCGAA 
TTCAAGCCTG GACAACTGGC AAGGGAATCT CGCCCGCAGT ATCCATTCAA CTCATTGCGG 
GAGGGGTTGG TCAATGCGCT GGTTCATCGC GATTATGCAG CATTCTCCGG CGGCGTTTCG 
GTTAGTATTT ACCCCGGACG TATTGAAATC TGGAATTCAG GACATCTTTC TATGGGGCTG 
ACTCCGGAAA AACTTCGGTC GGCGACTCAT GAATCCATTC TTGTCAACCC GGATATCAGC 
CATGTTTTCT ATCTGCATGA ATTGATGGAG CGGGTCGGAC GTGGTACGTT CAAAATTGTC 
CAGGAATGCC GGGATATGCG GATGCGTCCG CCAGTGTGGC AGAACAAGGT ATCCGGTGTA 
CATCTGACAT TTTTCGGGGT TGGGCAAGGA CAAATTTCTG TAAAGATCAA CGAACGACAA 
CGAGCGCTGC TTGATGGTCT AGCAGCCTGT CGGAATTGA

Protein sequence

MNVRNLTEEL LGKGESDRIE FIASARAENS IGRAVCALLN TKGGSVLVGV DDCGQVLGVL 
REEDADALRL FLHRHITPQV LFTVTLDDVQ GGRVITVDIP EGSDRPYVFD GAVYIKKGLD 
ILAVDAATMR EMVVRQSRET ERWERRVAVG LAIDDLDRKL LDETVRKAQD RGYRFEEVHK 
PDAVLADLAL ARFGQLTNAA DVLFGKRVAL RHPQTRLRAV CYETDRGDNF IDEQLYEGPA 
FYLLEEAMVF LKRHVAIAAE FKPGQLARES RPQYPFNSLR EGLVNALVHR DYAAFSGGVS 
VSIYPGRIEI WNSGHLSMGL TPEKLRSATH ESILVNPDIS HVFYLHELME RVGRGTFKIV 
QECRDMRMRP PVWQNKVSGV HLTFFGVGQG QISVKINERQ RALLDGLAAC RN