Gene Hhal_0190 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_0190
Symbol
ID	4711038
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	222667
End bp	223953
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	70%
IMG OID	639854648
Product	hypothetical protein
Protein accession	YP_001001786
Protein GI	121996999
COG category	[S] Function unknown
COG ID	[COG2311] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.55784
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTTATC CTAGCGGACC CATGCACCAC CCGGGGCATA CAGAGCAGCC TATGGGCAGC 
GGCCAACGCC TGGAGAGCCT CGATGCCGTC CGCGGGGCGG CAGTGCTGGG TATCCTGGTC 
ATCAACATCC AGCTCTTCGC CATGCCGGTG GCCGGGCTGT TGAGCCCGAC CCTGCTCGGC 
GGTTTCGAGG GCTGGGACTA CGTCGTCTGG GCCATCGGCC ACGTCTTCTT CGAGGGCAAG 
TTCATCGCCC TCTTCGCCGC CCTGTTCGGC GCCGGCGCCG TCCTGCTCGC CGAACGCCAC 
CGGGCGGCCG GCATCAACCC CTGGGTGGTC CACCGCCGGC GCATGCTCGC CCTCGGCGCC 
ATCGGCCTGG CCCACGGCAC CCTGTTGTGG ATGGGGGATA TCCTGTTCAT CTACGCCGCG 
ATGGGGCTGC TCGCCTTCCT GTTCATCGAC CGCACGCCGC GTGCGCTCCT GGCCTGGGGG 
GCCGCGCTCT ACGCCCTGCC CATCCTGCTG ACCATGGCCG CCGGCTGGGG GCTGACCCTG 
CTGCCCACCG CCGGCTTCAT CAAGCTCGCC TCCGCCTCGC CGCCCGTCCA CGAGGAGATC 
ACCGCGGCCA TCGAGGCCTA TCAGGGCGGA TGGCTGACGC AGATGGAGCA GCGCCTCCCC 
GAGGCCCTCA CCCGCTATCT GGTCGGCACC CCGGCACGCC TGGGCTGGCT GACCCTCGGC 
TGCATGCTGA TCGGCATGGC CGCGTACAAG AACGGCTTCC TCACCGGCGC CTGGAGCTCC 
CGGGCCTACG CGCGGGTGGT GGGCTACGGC CTGGGCATCG GCGTCCCGAT GAGCATCGTC 
GGGATCGCTT ACCGCGAGTG GCGCGACTGG GAATTGCTCA GCGGCTTCTT CTTCAGCACC 
CAGCTCAATC AGCTGGCGGT GCCCTTCGTC GCCGCAGGGT GGGCCGCCCT GATCATCCTC 
GCCTTCCAAC GCGGCTGGCT CGGACGCCTG CACTGGCCGT TGACCGCCGT AGGACGGACA 
GCCTTGAGTG GTTACCTGCT ACAGTCGGTG CTGTGTACCC TGGTCTTCTA CGGCCACGGG 
CTGGGGCTGT ACGGCGAGAT GGGGCGGCCG ACCCAGCTGC TGGTGGTACT CGGCGTCTGG 
CTGGTCCTGC TGATCGCCGC ACCCCTGTGG CTGCGCGCCT TCCGCATGGG ACCGGCGGAA 
TGGCTCCTCC GCCAGGCCAC ACAGCTGCCG AGACCGGCGC CACCATGCCC CCCGGTCCCC 
CCGCCGCGCA GCCCCGACGC CGGCTGA

Protein sequence

MLYPSGPMHH PGHTEQPMGS GQRLESLDAV RGAAVLGILV INIQLFAMPV AGLLSPTLLG 
GFEGWDYVVW AIGHVFFEGK FIALFAALFG AGAVLLAERH RAAGINPWVV HRRRMLALGA 
IGLAHGTLLW MGDILFIYAA MGLLAFLFID RTPRALLAWG AALYALPILL TMAAGWGLTL 
LPTAGFIKLA SASPPVHEEI TAAIEAYQGG WLTQMEQRLP EALTRYLVGT PARLGWLTLG 
CMLIGMAAYK NGFLTGAWSS RAYARVVGYG LGIGVPMSIV GIAYREWRDW ELLSGFFFST 
QLNQLAVPFV AAGWAALIIL AFQRGWLGRL HWPLTAVGRT ALSGYLLQSV LCTLVFYGHG 
LGLYGEMGRP TQLLVVLGVW LVLLIAAPLW LRAFRMGPAE WLLRQATQLP RPAPPCPPVP 
PPRSPDAG