Gene Hhal_2159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_2159
Symbol
ID	4709811
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	2371281
End bp	2372525
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	65%
IMG OID	639856634
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_001003725
Protein GI	121998938
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCGAGG TTGCCGAGGA TCGCGACGGC GAGTCCATCG TCTACCACCC GAAGACGGCG 
TGGCTGCGCC ACTATGGTGC CCCGTCGGTG TTGACCGCGG TGGCGATGGC GATCGCCTAC 
GCCTGGCCGG CGACAGGACC GCTGGCGGTG GTGCTCGGCG CCAGCGGTTG GGCCGCGGTC 
GGCTATCTGC GCCGACGCGA GACGGGGTGG AACGAGGCGA CGGATACCGT GGAGGATCTG 
GAAGACGCCC TGCGCGATCT GCTCCACGAC ATCGACGATA GTCTCAACGC CGAGTTCCGT 
ACGGTGAACA GTGACCTGGA GCAGATCCGC GGGCTCGTCG GCGACGCCGT GCAGTCGCTC 
AATCAGAGCT TCAACGGCAT GGATCAGGCC ACGGATGAAC AGGAACGCCT GGCTCGGGCG 
GTGATCGAGC AGACCGGCGG GGATTCGGCC GTGGAACAGT TCGGCATCGC CGAGTTCGTC 
CACGAGACCG AATCCTTCCT GAACAACTAC GTCGAGATGG TCGTCGACAT GAGTCGGCGC 
AGCGTGAAGA CCGTCGAGCG CATCGACGAT ATGGTCCACC AGATGGACCG GATCCACAAG 
CTGCTCGCCG ACCTCAAAGG GATCGCCAGC CAGACTGACC TGCTCGCTCT CAATGCCAGC 
ATCGAGGCGG CCCGCGCCGG TGAGTCCGGC CGCGGTTTCG CGGTGGTGGC CGAGGAGGTC 
CGCAAGCTCT CCGAGAAGGC CAACCAGTTC AACGAGCAGA TCGCTCAGGA GGTCAAGACC 
ATCAGTAACC TGGTGGACGA GGCGCGCACC GAGGTCGGCG AGATGGCCTC CAACGACATG 
AACGTGACCC TCACCACCAA GGAGCAGATC TCGGGGATGA TGAAGAGTCT CCAGGACGTG 
GATCAGCAGG TGGAGCAGCA GGTCAAGCGC ATCTCTGAGG TCAGTGGACA GATCGATCAC 
CACGTGGCCG ACGCCGTTCG TGCCCTGCAG TTCGAGGACA TTGTGACGCA GTTGGTGGAT 
GGCTCGCGCG CCGGGGTCGA GGGTTTGGAT GACTACCTCG ATGGCGTGCG CAATGTCCTG 
CAGGCCATCG CCGAGGAGGA CGTCCACGGC AGCCAGTACG CGGCGCGTCT ACGCGAGGCC 
CGCGAGCGGC TGGCGCAGCA GCGTCAGGAG CGCGAGACGG CGCGGGCCAG CCAGCGCAAG 
GTGGAGCAAC ACTCCATGGA TCACGGCGAC GTGGAGCTAT TCTGA

Protein sequence

MVEVAEDRDG ESIVYHPKTA WLRHYGAPSV LTAVAMAIAY AWPATGPLAV VLGASGWAAV 
GYLRRRETGW NEATDTVEDL EDALRDLLHD IDDSLNAEFR TVNSDLEQIR GLVGDAVQSL 
NQSFNGMDQA TDEQERLARA VIEQTGGDSA VEQFGIAEFV HETESFLNNY VEMVVDMSRR 
SVKTVERIDD MVHQMDRIHK LLADLKGIAS QTDLLALNAS IEAARAGESG RGFAVVAEEV 
RKLSEKANQF NEQIAQEVKT ISNLVDEART EVGEMASNDM NVTLTTKEQI SGMMKSLQDV 
DQQVEQQVKR ISEVSGQIDH HVADAVRALQ FEDIVTQLVD GSRAGVEGLD DYLDGVRNVL 
QAIAEEDVHG SQYAARLREA RERLAQQRQE RETARASQRK VEQHSMDHGD VELF