Gene Saro_0120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0120
Symbol	rho
ID	3916006
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	121800
End bp	123056
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	61%
IMG OID	640442845
Product	transcription termination factor Rho
Protein accession	YP_495403
Protein GI	87198146
COG category	[K] Transcription
COG ID	[COG1158] Transcription termination factor
TIGRFAM ID	[TIGR00767] transcription termination factor Rho

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.342043
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATCTCA AAGACCTCAA GAAGAAGACC CCCGCCGAGC TGGTCCAGAT GGCCGAAGAG 
CTCGAGGTCG AAGGCGCCAG CACCATGCGT CGCCAGGACC TGATGTTCGC TATCCTCAAG 
GAAATGGCCG AAGACGGCGA GGAAATCCTC GGCATCGGCA CGATCGAGGT TCTTCCCGAC 
GGTTTCGGCT TCCTGCGGAG CCCCGAAGCG AACTATCTCG CCGGACCCGA CGATATCTAC 
GTCTCGCCGA ACCAGGTCCG CAAATGGGGC CTGCGCACCG GCGACACGGT GGAAGGCGAA 
GTCCGCGCGC CCAAGGACGG GGAGCGCTAT TTCGCGATCA CCCGTCTGAT CAAGGTGAAC 
TTCGACGATC CCGAGGCCGT GCGCCACCGT GTCAACTTCG ACAACCTGAC CCCGCTCTAT 
CCGAACGAGC GACTGAAGCT CGACACGCTC GACCCGACGG TCAAGGACAA GTCGGCTCGT 
GTGATCGATC TCGTTTCGCC ACAGGGCAAG GGCCAGCGCG CGCTGATCGT CGCCCCTCCG 
CGCACCGGCA AGACCGTGTT GCTGCAGAAC ATGGCCAAGG CGATCACAGA CAACCATCCG 
GAAGTCTTCC TGATCGTGCT TCTGGTTGAC GAACGTCCCG AAGAAGTCAC CGACATGCAG 
CGTTCGGTGA AGGGCGAGGT CATTTCCTCG ACCTTTGACG AACCAGCCTC GCGCCACGTC 
CAGGTCGCTG AAATGGTCAT CGAGAAGGCC AAGCGTCTTG TCGAGCACAA GCGCGACGTG 
GTGATCCTGC TCGACTCGAT CACACGTCTC GGCCGTGCGT ACAACACCGT CGTGCCCTCG 
TCGGGCAAGG TGCTGACCGG CGGTGTCGAT GCCAACGCCC TGCAGCGTCC CAAGCGCTTC 
TTCGGCGCGG CGCGCAACAT CGAGGAAGGC GGTTCGCTTT CGATCATTGC CACGGCGCTG 
ATCGATACCG GCAGCCGCAT GGACGAAGTG ATCTTCGAAG AGTTCAAGGG CACCGGCAAC 
TCGGAAATCG TGCTGGACCG CAAGGTTGCG GACAAGCGCA TCTTCCCGGC GCTGGACGTG 
GGCAAGAGCG GTACCCGCAA GGAAGAACTG CTCGTACCGA AGGATCAGCT CTCGAAGATG 
TGGGTCCTGC GCCGCATCTT GATGCAGATG GGCACTGTCG ATGCGATGGA GTTCCTGCTC 
GACAAGATGA AGGATTCGAA AACCAACGAA GACTTCTTCG CGACGATGAA CCAGTAA

Protein sequence

MHLKDLKKKT PAELVQMAEE LEVEGASTMR RQDLMFAILK EMAEDGEEIL GIGTIEVLPD 
GFGFLRSPEA NYLAGPDDIY VSPNQVRKWG LRTGDTVEGE VRAPKDGERY FAITRLIKVN 
FDDPEAVRHR VNFDNLTPLY PNERLKLDTL DPTVKDKSAR VIDLVSPQGK GQRALIVAPP 
RTGKTVLLQN MAKAITDNHP EVFLIVLLVD ERPEEVTDMQ RSVKGEVISS TFDEPASRHV 
QVAEMVIEKA KRLVEHKRDV VILLDSITRL GRAYNTVVPS SGKVLTGGVD ANALQRPKRF 
FGAARNIEEG GSLSIIATAL IDTGSRMDEV IFEEFKGTGN SEIVLDRKVA DKRIFPALDV 
GKSGTRKEEL LVPKDQLSKM WVLRRILMQM GTVDAMEFLL DKMKDSKTNE DFFATMNQ