Gene Dole_0470 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0470
Symbol	rho
ID	5693291
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	535141
End bp	536385
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	58%
IMG OID	641263053
Product	transcription termination factor Rho
Protein accession	YP_001528357
Protein GI	158520487
COG category	[K] Transcription
COG ID	[COG1158] Transcription termination factor
TIGRFAM ID	[TIGR00767] transcription termination factor Rho

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00000467448
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATATAT CCGAGCTGAA AAAAAAGAAG ATGGATGAGT TAAAGGAGAT TGCCGCCGGT 
TACGAGGTCG ACAGCGCCGG CATGAAAAAG CAGGAACTGA TTTTTTCGAT TCTGCAGGCC 
GAGGCGGAAA ACAACGGGTA TATCTTCGGT GAAAGCACGC TGGAGGTCCT TTCCGACGGG 
TTCGGTTTTT TACGGTCCCC GGACAGCAGC TATCTGCCGG GGCTGGATGA TATTTACGTG 
TCGCCTTCCC AGATTCGGCG GTTCAACCTC CGTACCGGCG ACATCGTGTC GGGTCAGATC 
CGTCAGCCCA AGGAGAATGA GCGCTATTTC GCGCTGCTGA AGGTGGAGGC CATCAACCAC 
GAAGACCCGG AGATCGCGCG GCACAAAACC CCTTTTGACA ACCTCACCCC TCTGTTCCCC 
AATGAAAAGA TCAAGCTGGA GCGCGAGTCG GACAACTACT CCATGCGGAT CATGGACCTG 
CTGACCCCCA TCGGTTTCGG CCAGCGGGGG CTGATCGTGT CGCCGCCCCG GGCCGGCAAG 
ACCATGCTGC TGCAGAACAT TGCCAACAGC ATCATTGCCA GCCACAAGAA GGTGGTGCCC 
TTTGTGCTGC TCATCGATGA ACGGCCTGAG GAAGTGACCG ACATGAAGCG TTCCGTTAAC 
GCTGAAGTGA TCAGCTCCAC GTTTGACGAG CCGGCCGACC GCCATGTGCA GGTGGCGGAA 
ATGGTCATTG AAAAGGCACG GCGCCTGGTG GAGCATAAAA AGGATGTGGT GATCCTGCTT 
GACAGCATCA CCCGCCTGGC CCGGGCTTAC AACTCGGTGG TGCCCTCCAG CGGCAAGGTG 
CTGTCCGGCG GCGTGGATTC CAACGCCCTG CACCGGCCCA AGCGGTTTTT CGGCGCGGCC 
CGCAATATTG AGGAGGGCGG CAGCCTCACC ATCATGGCCA CGGCCCTGAT CGACACCGGC 
AGCCGCATGG ATGATGTGAT TTTTGAGGAG TTCAAGGGCA CCGGCAACAT GGAGCTTCAT 
CTGGACCGGA AGCTGGCCGA TCGGCGCGTC TACCCGGCCA TCGATATCAA CCGGTCCGGC 
ACCCGTAAAG AGGAACTGCT GGTGGAAAAG GATGTGCTCA ACCGGGTATG GGTGCTGCGC 
AAGCTGCTGG CGACCCTGAA CTCCGTGGAC GGCATGGAAT TTCTGCTCGA CAAGATGAGC 
AGCACCAAAA GCAATAAGGA TTTTATGGAT GCCATGAATT CATAG

Protein sequence

MDISELKKKK MDELKEIAAG YEVDSAGMKK QELIFSILQA EAENNGYIFG ESTLEVLSDG 
FGFLRSPDSS YLPGLDDIYV SPSQIRRFNL RTGDIVSGQI RQPKENERYF ALLKVEAINH 
EDPEIARHKT PFDNLTPLFP NEKIKLERES DNYSMRIMDL LTPIGFGQRG LIVSPPRAGK 
TMLLQNIANS IIASHKKVVP FVLLIDERPE EVTDMKRSVN AEVISSTFDE PADRHVQVAE 
MVIEKARRLV EHKKDVVILL DSITRLARAY NSVVPSSGKV LSGGVDSNAL HRPKRFFGAA 
RNIEEGGSLT IMATALIDTG SRMDDVIFEE FKGTGNMELH LDRKLADRRV YPAIDINRSG 
TRKEELLVEK DVLNRVWVLR KLLATLNSVD GMEFLLDKMS STKSNKDFMD AMNS