Gene Cagg_1356 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1356
Symbol	rho
ID	7268648
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1680458
End bp	1681711
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	56%
IMG OID	643566199
Product	transcription termination factor Rho
Protein accession	YP_002462699
Protein GI	219848266
COG category	[K] Transcription
COG ID	[COG1158] Transcription termination factor
TIGRFAM ID	[TIGR00767] transcription termination factor Rho

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00013646
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000000585861
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACTTCAG GAATTGCCGA AACCGCCGAG AAGGTTCGTC GTCGGCGTCG CCGGGTGAAT 
GGTGAGGCGA GCGAATCTAC GACCAATGAA ACCGTGGCGG TGACCACTCC ACCCACAACC 
ACAACGGTAA TTGAAGAACC GGTGACGATG CAAGGTTCTG GTATCCTCGA AATCGTTCCT 
GATGGTCACG GTTTTCTCCG CAATCCTCGC CTGACACCTG GCACCGATGA TGTCTACGTG 
GCACAGTCGC AAATTCGTCG TTTTAACCTG CGTACCGGCG ATATGATCGA AGGACGGGTG 
CGTCCGCCGA AAGAGGTCGA GCGTTATCCG TCGCTGCTCT ATGTCGAGCG GGTGAATGGC 
TTGCCGGCGG AAGCTGCACA AAAACGGCCA CTCTTCGAGC ATTTGACACC GATCCATCCC 
AATGTCCAAA TTGTGCTCTC GACCGAGGCG AATATTCTGC CTACCCGGAT TGTTGATGTC 
ATTGCGCCGA TTGGGCGTGG GCAGCGCGGG TTGATCGTTG CGCCACCCAA GGCCGGGAAG 
ACGATGCTCC TGAAGGCTAT TGCCAACGGT ATTACGACCA ATGCACCCGA TATTCAGTTG 
ATCGTGCTGC TGATCGGTGA GCGACCCGAA GAAGTGACCG ATATGCGGCG GTCGGTGCAG 
GGCGAAGTGG TGGCCGCTAC CTTTGATGAA CCGGTTGAGC AGCATATTAA GGTTGCTGAA 
TTGGTACTGG AGAAGGCAAA ACGACAAGTT GAGCACGGTC GCCACGTGGT GATCTTGATG 
GACTCGCTGA CCCGCTTGAC CCGTGCCTAC AATATCGCGA TGCCGCCTAG TGGACGAACA 
CTTTCCGGTG GTGTCGATCC CGCTGCCCTC TATCCGCCAA AACGTTTCTT CGGCTCGGCT 
CGCAATATTG AAGATGGTGG TTCCCTCACT ATTATTGCGA CCTGTCTGGT CGATACCGGT 
TCACGGATGG ATGATGTGAT CTACGAAGAG TTCAAAGGCA CCGGTAACAT GGAACTGCAT 
CTCGATCGTA AACTGGCCGA GAAGCGCATC TTCCCCGCCG TTGATATTCA GCGCTCGGGT 
ACGCGCCGTG AGGATCTGTT GCTCGATCCG GTAACGCTGC GCCAGAGCTG GATGTTGCGA 
CGGATGGTCA GCATGGTTGG TGAGAATGAA GGCGCTGAGC TGATGCTGAC CCGGATGGCG 
AAGACGAAGA GCAACGCTGA GTTTTTGGCG TCGCTCGGTA AGGTGGGTTC GTGA

Protein sequence

MTSGIAETAE KVRRRRRRVN GEASESTTNE TVAVTTPPTT TTVIEEPVTM QGSGILEIVP 
DGHGFLRNPR LTPGTDDVYV AQSQIRRFNL RTGDMIEGRV RPPKEVERYP SLLYVERVNG 
LPAEAAQKRP LFEHLTPIHP NVQIVLSTEA NILPTRIVDV IAPIGRGQRG LIVAPPKAGK 
TMLLKAIANG ITTNAPDIQL IVLLIGERPE EVTDMRRSVQ GEVVAATFDE PVEQHIKVAE 
LVLEKAKRQV EHGRHVVILM DSLTRLTRAY NIAMPPSGRT LSGGVDPAAL YPPKRFFGSA 
RNIEDGGSLT IIATCLVDTG SRMDDVIYEE FKGTGNMELH LDRKLAEKRI FPAVDIQRSG 
TRREDLLLDP VTLRQSWMLR RMVSMVGENE GAELMLTRMA KTKSNAEFLA SLGKVGS