Gene Sala_2845 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_2845
Symbol	rho
ID	4080638
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	2996954
End bp	2998210
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	61%
IMG OID	638011229
Product	transcription termination factor Rho
Protein accession	YP_617883
Protein GI	103488322
COG category	[K] Transcription
COG ID	[COG1158] Transcription termination factor
TIGRFAM ID	[TIGR00767] transcription termination factor Rho

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.495163
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0341841
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACTTGA AAGAACTCAA AACAAAATCG CCCGCGCAGC TCGTCGAAAT GGCCGAGGAA 
CTGGGCGTCG AGGGCGCATC GACGATGCGC AAGCAGGATC TGATGTTCTC GATCCTGAAG 
GAGCTCGCCG AAGAGGGCGA GGAAATCATC GGGTCGGGGA CGATCGAGGT ACTGCCCGAC 
AGCTTCGGGT TCCTGCGCTC GTCCGAGGCC AATTATCTCG CCGGTCCCGA CGACATCTAT 
GTCTCGCCGA ACCAGGTCCG CAAATATGGC CTGCGTACCG GCGACACCGT CGAGGGCGAG 
ATTCGTGCGC CGCGCGATGG CGAACGCTAT TTCGCGCTCA CCAAGCTGAT CAGCGTCAAT 
TTCGACGATC CCGACGTCGT GCGCCACCGC GTCAATTTCG ATAACCTCAC ACCGCTCTAT 
CCGAACCAGA AGCTGTCGCT CGACACCGTC GATCCGACGG TCAAGGACAA GTCGGCGCGC 
GTCATCGACC TTGTCAGCCC GCAGGGCAAG GGGCAGCGCG CGCTGATCGT CGCGCCGCCG 
CGCACCGGCA AGACGGTGCT CTTGCAGAAT ATCGCCAAGG CGATCACCGA CAACCACCCG 
GAAGTTTACC TCATCGTCCT CCTCGTCGAC GAACGGCCCG AGGAAGTCAC CGATATGCAG 
CGCAGCGTGA AGGGCGAGGT CGTTTCCTCC ACCTTCGACG AACCCGCGAC GCGCCACGTC 
CAGGTCGCCG AAATGGTGAT CGAAAAGGCC AAGCGTCTCG TCGAGCACAA GAAGGATGTC 
GTCATCCTGC TCGATTCGAT CACGCGCCTC GGTCGTGCCT ACAACACCGT CGTCCCTTCG 
TCGGGCAAGG TGCTGACCGG CGGCGTCGAC GCCAATGCGC TGCAGCGGCC GAAGCGTTTC 
TTCGGCGCCG CGCGCAACAT CGAAGAGGGC GGTTCGCTGT CGATCATCGC CACGGCGCTG 
ATCGATACCG GCAGCCGCAT GGACGAGGTC ATCTTCGAAG AGTTCAAGGG CACGGGTAAC 
AGCGAAATCG TGCTCGACCG CAAGGTTGCC GACAAGCGCA TCTTCCCGGC GCTCGACGTC 
GGCAAGTCGG GCACGCGCAA GGAAGAATTG CTCGTTGAAA AGGACAAGCT CTCGAAAATG 
TGGGTGCTGC GCCGCATCCT CATGCAGATG GGCACCGTCG ACGCAATGGA GTTCCTGCTC 
GACAAGATCA AGGATTCGAA GACAAACGAG GATTTCTTCG ATTCGATGAA CCAATAG

Protein sequence

MHLKELKTKS PAQLVEMAEE LGVEGASTMR KQDLMFSILK ELAEEGEEII GSGTIEVLPD 
SFGFLRSSEA NYLAGPDDIY VSPNQVRKYG LRTGDTVEGE IRAPRDGERY FALTKLISVN 
FDDPDVVRHR VNFDNLTPLY PNQKLSLDTV DPTVKDKSAR VIDLVSPQGK GQRALIVAPP 
RTGKTVLLQN IAKAITDNHP EVYLIVLLVD ERPEEVTDMQ RSVKGEVVSS TFDEPATRHV 
QVAEMVIEKA KRLVEHKKDV VILLDSITRL GRAYNTVVPS SGKVLTGGVD ANALQRPKRF 
FGAARNIEEG GSLSIIATAL IDTGSRMDEV IFEEFKGTGN SEIVLDRKVA DKRIFPALDV 
GKSGTRKEEL LVEKDKLSKM WVLRRILMQM GTVDAMEFLL DKIKDSKTNE DFFDSMNQ