Gene Dret_0843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0843
Symbol	rho
ID	8418662
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	999635
End bp	1000882
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	54%
IMG OID	645037412
Product	transcription termination factor Rho
Protein accession	YP_003197712
Protein GI	258404970
COG category	[K] Transcription
COG ID	[COG1158] Transcription termination factor
TIGRFAM ID	[TIGR00767] transcription termination factor Rho

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000000858809
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.0802102
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCTAT CCGAGATGAA AAGGAAATCC ATGGCCGAAC TCATGCAGTT GGCCAAGGAG 
TATAAAGTCG AAAACCCAAG CGGTCTTCGC AAGCAGGAAC TGATTTTTGC CATCCTCAGT 
TCCTGTGCTT CGCAAAACGG CTCGATCTAT GGGGAAGGCG TGCTGGAGAT TTTGCCCGAC 
GGGTTCGGCT TTCTTCGCTC CCCCATGTAC AGCTATATTC CGGGACCGGA CGATATTTAC 
GTCTCCCCGT CGCAGATCCG CCGCTTCGGC CTGCGCAAGG GTGACGTGGT CTCCGGGCAG 
ATCCGCCCGC CCAAGGAAGG GGAGCGGTAT TTCGCTTTGC TCCGGGTACA GCAAGTTGGG 
TTTGCCACTC CAGAAGAATC CAAGAACCTA GTCCTGTTTG ATAATTTAAC GCCGATTTAT 
CCGGACCAGC GCTTTGTCAT GGAAACTGGG GCGGAAAGCT ACTCCTCGCG GGTTGTGGAT 
CTGCTGGCCC CCATAGGTAA GGGACAGCGC GGGCTCATAG TAGCCCCGCC ACGCACCGGA 
AAAACGATGC TTTTGCAAAG TATCGCCAAC TCCATTACCG CCAACCACCC TGATTCCTAT 
CTTATTGTGC TCCTGATCGA CGAACGACCT GAAGAAGTGA CGGATATGGA GCGTACCGTC 
GACGGCGAAG TTGTCAGTTC GACGTTCGAC GAGCCTCCCC AACGTCATGT CCAGGTGGCG 
GAAATGGTTT TGGAAAAAGC CAAACGCCTT GTGGAACGCA AAAAAGATGT CGTTATCCTC 
CTGGACAGTA TCACCCGTTT CGGTCGAGCC CACAACGCGA TCATTCCTTC GTCAGGACGG 
GTCCTCTCTG GCGGTCTGGA CTCCAACGCC CTGCAACGAC CGAAGCGTTT TTTTGGGGCT 
GCGCGGAATA TCGAGGAAGG CGGGAGTCTG ACCATTATCG CTACGGCGCT TATCGATACC 
GGATCGCGCA TGGATGAGGT CATCTTTGAG GAATTCAAGG GCACCGGAAA TATGGAAATT 
TACCTGGATC GCCATCTGGC CGACAAGCGC GTCTTTCCGG CCATTGATAT CAACCGTTCC 
GGCACCCGCA AGGAGGACCT GCTTTTGGAC GAGAACGTCT TGAACCGGGT TTGGATATTG 
CGTAAGCTTC TGGCTCCCAT GAATTCAGTG GAGAGCATGG AGTTTCTCCT GGACAAAATG 
CGCGGCACAA AGAGCAACCG CGAGTTTCTC GATATGATGA ACAGTTAG

Protein sequence

MNLSEMKRKS MAELMQLAKE YKVENPSGLR KQELIFAILS SCASQNGSIY GEGVLEILPD 
GFGFLRSPMY SYIPGPDDIY VSPSQIRRFG LRKGDVVSGQ IRPPKEGERY FALLRVQQVG 
FATPEESKNL VLFDNLTPIY PDQRFVMETG AESYSSRVVD LLAPIGKGQR GLIVAPPRTG 
KTMLLQSIAN SITANHPDSY LIVLLIDERP EEVTDMERTV DGEVVSSTFD EPPQRHVQVA 
EMVLEKAKRL VERKKDVVIL LDSITRFGRA HNAIIPSSGR VLSGGLDSNA LQRPKRFFGA 
ARNIEEGGSL TIIATALIDT GSRMDEVIFE EFKGTGNMEI YLDRHLADKR VFPAIDINRS 
GTRKEDLLLD ENVLNRVWIL RKLLAPMNSV ESMEFLLDKM RGTKSNREFL DMMNS