Gene Hhal_2055 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_2055
Symbol	rho
ID	4710011
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	2258120
End bp	2259379
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	65%
IMG OID	639856528
Product	transcription termination factor Rho
Protein accession	YP_001003621
Protein GI	121998834
COG category	[K] Transcription
COG ID	[COG1158] Transcription termination factor
TIGRFAM ID	[TIGR00767] transcription termination factor Rho

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.224008
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCTCA CCGAGCTCAA GAGAAAGCCA GCCACCGAAC TCCTGGAGAT CGCCCAGTCC 
ATGGGCATCG AGGGCACTGC CCGCTCCCGG AAGCAGGACA TCATCTTCGC CATCCTCAAG 
GCTCATGCCA AGAACGGCGA TTCCATCTAC GGCGACGGCG TCCTCGAGAT CCTCCAGGAC 
GGCTTCGGCT TCCTGCGCTC CGCGGATGCC TCGTACATGG CCGGGCCGGA CGATATCTAC 
GTCTCGCCCA GCCAGATCCG CCGGTTCGCA CTGCGCACCG GCGACACCAT CACCGGCAAG 
ATCCGCCCCC CGAAGGACGG CGAGCGCTAC TTCGCCCTGC TCAAGGTCGA CCAGATCAAC 
TTCGAGCCGC CGGAGGCGGC CAAGAACAAG GTCCTCTTCG AGAACCTCAC TCCGCTGTTC 
ACCCGCGATC GCATGCGCAT GGAGCGGGGC AACGGCTCCA CCGAGGACCT CACCGCCCGG 
GTCATTGACC TGGTGGCGCC TATCGGCAAG GGCCAGCGCG GGCTGATCGT CTCGCCCCCG 
AAGGCCGGCA AGACGATGAT GCTCCAGAAC GTCGCCCAGA GCATCACCTA CAACTACCCG 
GAGTGCTACC TCATCGTCCT GCTCATCGAC GAGCGGCCCG AGGAGGTCAC TGAGTTCGCC 
CGCTCGGTGC TCAGCGCCGA GACGGTCTCC TCGACCTTCG ACGAGCCGGC CTCGCGCCAC 
GTCCAGGTCG CCGAGATGGT CATCGAGAAG GCCAAGCGCC TGGTCGAGCA CAAGAAGGAC 
GTGGTCATCC TGCTCGACTC CGTCACCCGC CTGGCGCGCG CCTATAATAC GGTGGTGCCG 
TCGTCCGGTA AGGTGCTCAC CGGGGGCGTG GATGCCAACG CCCTGCACCG GCCCAAGCGC 
TTCTTCGGTG CCGCGCGCAA CGTCGAAGAG GGCGGCAGCC TCACCATCCT GGCCACCGCC 
CTGGTCGAGA CCGGCTCGCG CATGGACGAG GTGATCTACG AGGAGTTCAA GGGCACCGGC 
AACATGGAGC TGCACATGGA CCGGAAGATC GCCGAGAAGC GCATCTACCC GGCCATCCAC 
CTGAACCGCT CTGGGACCCG GCGCGAGGAA CTCCTGATGA CCCCCGAGGA GCTGCAGAAG 
ACCTGGATCC TGCGCAAGCT CCTGCACAAC ATGGACGAGG TGGCCGCCAT CGAGTTCCTC 
CTCGACAAGC TCAAGGACAC CAAGACCAAC ACCGAGTTCT TCGAGGCCAT GAAACGCTGA

Protein sequence

MNLTELKRKP ATELLEIAQS MGIEGTARSR KQDIIFAILK AHAKNGDSIY GDGVLEILQD 
GFGFLRSADA SYMAGPDDIY VSPSQIRRFA LRTGDTITGK IRPPKDGERY FALLKVDQIN 
FEPPEAAKNK VLFENLTPLF TRDRMRMERG NGSTEDLTAR VIDLVAPIGK GQRGLIVSPP 
KAGKTMMLQN VAQSITYNYP ECYLIVLLID ERPEEVTEFA RSVLSAETVS STFDEPASRH 
VQVAEMVIEK AKRLVEHKKD VVILLDSVTR LARAYNTVVP SSGKVLTGGV DANALHRPKR 
FFGAARNVEE GGSLTILATA LVETGSRMDE VIYEEFKGTG NMELHMDRKI AEKRIYPAIH 
LNRSGTRREE LLMTPEELQK TWILRKLLHN MDEVAAIEFL LDKLKDTKTN TEFFEAMKR