Gene Hhal_1188 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1188
Symbol
ID	4710234
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	1292422
End bp	1293429
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	65%
IMG OID	639855661
Product	extracellular solute-binding protein
Protein accession	YP_001002765
Protein GI	121997978
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.244132
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCCGCC CGATCCCTGT GGCAACCGCG CTGATTGCTG GTGCTGTCCT GATCACCGGT 
TGCGATACCG GCGACGACGA GCTGACGGTC TACTCGGCCC GCCAGGACCA CCTGATCAGC 
CCGATCCTCG AGCGTTTCAC GGAAGAAACC GGGATCTCCG TGCGTTTCGT CACCGACGAC 
GCGGGGCCGC TGATGGAGCG CCTCAAGGCC GAGGGCGAGC GCACCCCGGC GGATATCCTG 
CTGACCGTGG ATGCCGGCAA CCTCCACCAG GCCACCGAGA ACGACCTGCT CGCCAGGCTC 
GATTCATCCG AGCTGCGCGG ACGCATCCCA GAGCACCTGC GCGATCCGGA CGACCGGTGG 
TTCGGGCTTT CGGTACGCGC GCGCACCATC ATGTACAGTC CTGAGCGCGT CGACCCGGAG 
GAGCTGGATA GCTATGCCAA TCTGGCCGAC GAGAAGTGGG AGGGGCGCCT TTGCCTGCGG 
ACCTCGCAGC AGGTCTACAA CCAGTCGCTG GTGGCCATGA TGCTTCACCA CGAGGGCGAG 
GAAGAGACGG CCCGCATCGT CGAGGGCTGG GTCGACAATC TGGCCACCTC GCCGTTCTCC 
AACGATACCG CGGTCCTCGA AGCCATCGAG GCCGGACAGT GCGACGTGGG CATTACCAAC 
ACCTACTACC TCGGCCGGGT CCTCCGCGAC AACCCCGATT TCCCGGTTGA GGTCTTCTGG 
GCCGATCAGG ACGGCCACGG TACCCACGTC AACGTATCCG GGGCCGGAAT CACCCAGCAC 
GCCTCCAACC CCGAGAAAGC GCAGAAGCTG CTGGAGTGGC TGGCCAGCGA TGACGCTCAA 
GAGCAATTCG CCGCGATCAA CCTCGAATAC CCCGCGGTGG AGGGCGTCGA TCTCGACCCC 
ATCGTCGCCA ATTGGGGGGA GTTTGAGCCC GACACCATCA ATGTCAGCGA GGCGGGCCGG 
CTTCAGCGTG AGGCCACCAT GCTGATGGAC CGAGCCGGGT ACCGGTAA

Protein sequence

MFRPIPVATA LIAGAVLITG CDTGDDELTV YSARQDHLIS PILERFTEET GISVRFVTDD 
AGPLMERLKA EGERTPADIL LTVDAGNLHQ ATENDLLARL DSSELRGRIP EHLRDPDDRW 
FGLSVRARTI MYSPERVDPE ELDSYANLAD EKWEGRLCLR TSQQVYNQSL VAMMLHHEGE 
EETARIVEGW VDNLATSPFS NDTAVLEAIE AGQCDVGITN TYYLGRVLRD NPDFPVEVFW 
ADQDGHGTHV NVSGAGITQH ASNPEKAQKL LEWLASDDAQ EQFAAINLEY PAVEGVDLDP 
IVANWGEFEP DTINVSEAGR LQREATMLMD RAGYR