Gene Cagg_3627 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3627
Symbol	rho
ID	7269771
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	4406926
End bp	4408188
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	51%
IMG OID	643568434
Product	transcription termination factor Rho
Protein accession	YP_002464900
Protein GI	219850467
COG category	[K] Transcription
COG ID	[COG1158] Transcription termination factor
TIGRFAM ID	[TIGR00767] transcription termination factor Rho

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.2483
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.795626
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGTAG CTGAATTAGA AAGTAAAACC CTCGCAGATT TGCGCGAGAT AGCACGAAAA 
TATGACATCT CAGGTGTTAG CTCGCTGAAA AAACGTGAAT TAATCGACAA GTTACTCCAG 
GTCCAGATGG CAACCGTCGC ACCAACGACA GATACGGAAA CAATTTACAG CGACGGGATT 
TTAGACATTA TGCCGGAAGG ATTCGGTTTT TTGCGCGGCA GTCGGATGCT GCCCAGCCCA 
GAGGATGTCT ACGTTTCACA ATCACAGATT CGCCGCTTTG CCTTACGGAG TGGTGATCGG 
ATCTGGGGAC AGATTCGCCC ACCCAAGGAG AACGAGCGCT ACTACTCACT GTTACGTGTG 
GAAAAGATAA ATGACCAAGA CCCCGAAACG GCACGTAAAC GGCCGCTGTT TGATCAGCTC 
ACACCGATTT TTCCCAACGA ACAGATCAAG TTAGAAACCG AACCCAATCT TTTACATACT 
CGATTAGTCG ATCTGATTGC TCCCATCGGC CGTGGTCAGC GTGGCCTCAT CGTTTCACCA 
CCGAAAGCCG GCAAAACAAT GCTGTTGAAG GCAATTGCCA ACGGCATTAC GACCAACTAT 
CCTGACATCC ATTTGATGGT ATTGTTGATC GGTGAACGAC CCGAAGAGGT CACCGATATG 
CGGCGTTCGG TACGAGGTGA GGTGATTTCT TCGACCTTTG ATGAGCCGGT AGAAAACCAC 
ACAAAAGTCG CCGAAATGAC GCTTGAACGG GCGAAGCGGC TCGTTGAGAT TGGTCATGAT 
GTCGTGATTC TTATGGACTC CATCACCCGG TTAGCCCGTG CTTACAATGT CGCAATGCCT 
CCGAGTGGGC GCACACTATC CGGTGGTATC GACCCAATTG CACTCTACCC ACCCAAACGC 
TTTTTTGGCG CCGCACGCAA CATCGAAAAC GGTGGATCGC TCACGATCAT CGCCACCTGT 
CTCATCGATA CCGGTTCACG CATGGATGAC GTCATTTACG AAGAGTTTAA AGGCACCGGT 
AATATGGAGC TACACCTCGA CCGGAAGTTG GCCGAAAAAC GGATCTTCCC GGCGATTGAC 
ATTCAACGTT CCGGCACGCG CCGTGAGGAT CTCTTACTTA ACCCCGAGAC GCTCCGCCAA 
GTGTGGACGT TGCGCCGTAT GGTGAGTATG CTCGGTGACA ATGAAGGCAC TGAGCTGATG 
CTGACCCGGA TGGCAAAGAC GAAATCGAAT GCCGAATTCC TGCAAACGTT GAGCAAAAGC 
TGA

Protein sequence

MTVAELESKT LADLREIARK YDISGVSSLK KRELIDKLLQ VQMATVAPTT DTETIYSDGI 
LDIMPEGFGF LRGSRMLPSP EDVYVSQSQI RRFALRSGDR IWGQIRPPKE NERYYSLLRV 
EKINDQDPET ARKRPLFDQL TPIFPNEQIK LETEPNLLHT RLVDLIAPIG RGQRGLIVSP 
PKAGKTMLLK AIANGITTNY PDIHLMVLLI GERPEEVTDM RRSVRGEVIS STFDEPVENH 
TKVAEMTLER AKRLVEIGHD VVILMDSITR LARAYNVAMP PSGRTLSGGI DPIALYPPKR 
FFGAARNIEN GGSLTIIATC LIDTGSRMDD VIYEEFKGTG NMELHLDRKL AEKRIFPAID 
IQRSGTRRED LLLNPETLRQ VWTLRRMVSM LGDNEGTELM LTRMAKTKSN AEFLQTLSKS