Gene Clim_0323 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0323
Symbol	rho
ID	6353840
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	357766
End bp	359055
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	51%
IMG OID	642667952
Product	transcription termination factor Rho
Protein accession	YP_001942396
Protein GI	189345867
COG category	[K] Transcription
COG ID	[COG1158] Transcription termination factor
TIGRFAM ID	[TIGR00767] transcription termination factor Rho

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0180092
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGAACA ATTCGGTTTC CAAGGGTCTG GACATCAATG TACTCCAGAA AAAGAAAGTG 
TATGAGTTGA ATGCTCTTGC AAAAGAAATA GGGGTATCTG CGGCCGGCTT ACGGAAAGAA 
GAGCTGATAT TCAAGATAAT AGAGGCACAG TCACAGAAAA ATACGGATCC TGAAGGCGCC 
CAGGTGATGG TCAATACCGG AGTTCTGCAG GTTATTCCTG AAGGATACGG ATTTTTGCGT 
TCCGCAAATT ACAACTATCT CTCCTCTCCT GACGATATCT ATGTTTCTCC GTCCCAGATC 
AAGCGTTTCA ATATGCGAAC CGGTGATACC GTATCCGGTC AGGTGCGGGC TCCGAAAGAG 
GGTGAGCGTT TTTTTGCCCT GCTGAAAATC AATACCATCG ACGGAAACGA TCCTGAAATC 
ACCAGGGAAC GGCCTTTTTT TGAAAACCTA ACCCCGCTCT TTCCCAATGA ACGCCTGAAG 
CTTGAAACCC GCCAGACGGA GTATTGCGGC AGGATCATGG ATATCTTCAC TCCGATCGGC 
AAGGGACAGC GCGGTCTGAT CGTCGCACAG CCGAAAACAG GAAAGACCAT GCTGCTGCAG 
ATGATCGCCA ATGCGATCAT TAAAAACCAT CCCGAAGTTT TTCTGATCGT GCTTCTGATC 
GATGAACGTC CCGAAGAGGT TACCGACATG GCGCGCAGCG TCGAGGCTGA AGTGGTGAGT 
TCCACCTTCG ACGAGGATCC CGAGCGTCAC GTCCAGGTTG CCGATATGGT GCTTGAAAAG 
GCCAAGCGGC TTGTCGAAGT AGGAAGGGAT GTGGTGATTC TGCTCGATTC CATCACCAGG 
CTCGCTCGTG CGCACAATAC CATCATTCCT CACTCCGGCA AGATTCTTTC CGGCGGTATC 
GATGCCAACG CGCTCACCAA ACCGAAACGT TTCTTCGGTG CGGCCCGCAA CATCGAGGAG 
GGAGGCAGCC TCACCATCAT CGCTACGGCG CTTGTCGATA CCGGCTCCCG GATGGATGAC 
GTTATTTTTG AGGAGTTCAA GGGTACCGGT AACATGGAGC TTGTGCTCGA TCGCAGGCTT 
TCCGAACGCA GAATTTTTCC GGCCATCGAT ATTCTCCGTT CCGGAACCCG GAAGGAGGAA 
CTGCTCTTCA GTCAGGAAGA GCTGTCGAGA ACCTGGCTGC TGAGAAAATA CCTTGCAGAC 
AAGAATCCTG TCGAGTGCAT GGAGTTCATG CGCGAAAAAA TGAGTGACAC AAAGGACAAC 
AAGGATTTTT TCAAATACAT GAACGCTTGA

Protein sequence

MSNNSVSKGL DINVLQKKKV YELNALAKEI GVSAAGLRKE ELIFKIIEAQ SQKNTDPEGA 
QVMVNTGVLQ VIPEGYGFLR SANYNYLSSP DDIYVSPSQI KRFNMRTGDT VSGQVRAPKE 
GERFFALLKI NTIDGNDPEI TRERPFFENL TPLFPNERLK LETRQTEYCG RIMDIFTPIG 
KGQRGLIVAQ PKTGKTMLLQ MIANAIIKNH PEVFLIVLLI DERPEEVTDM ARSVEAEVVS 
STFDEDPERH VQVADMVLEK AKRLVEVGRD VVILLDSITR LARAHNTIIP HSGKILSGGI 
DANALTKPKR FFGAARNIEE GGSLTIIATA LVDTGSRMDD VIFEEFKGTG NMELVLDRRL 
SERRIFPAID ILRSGTRKEE LLFSQEELSR TWLLRKYLAD KNPVECMEFM REKMSDTKDN 
KDFFKYMNA