Gene Hhal_1125 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1125
Symbol
ID	4710089
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	1222069
End bp	1223667
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	69%
IMG OID	639855597
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_001002703
Protein GI	121997916
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCGAGTCA ATGACCCGGT CACGCAGCGA CGTGTTGCCG TCTGGGATGG CGCCAACATC 
CTGTCGACTA CCGACTCCCG CGGACGGATC CGCTATATCA ACGAGGACTT TGTGCGCATC 
AGCGGCTACC AGCCGGAAGA GCTGATCGGG CAGCCGCACA ACGTCATCCG CCACCCGGAC 
ATGCCCCGGG TGGTCTTCGA GCACATGTGG CAACGCCTGC AGGCCGGGCA GCCGTGGATG 
GGAATCATCA AGAATCGCTG CAAGAACGGC GATCACTACT GGGTTCACGC CTACGCAACG 
GCCATCCGCG ACGACGCGGG CAACATCACC GAGATCCAGT CGGTACGTCA GCAGATCAAT 
GACGAGGCGG TGGTCGCCCG AGCCGAGCGC GCTTACAAGC GCCTGCGCGC CGCCGAACCG 
GACAAGGGGG CACTGCCCGC CGGACTGATC GGCCGGCGGG CAGTGGGGAG CGGCGTGTGG 
CTCGCCGCCG GGGGGACGGC CGCACTACTC GGCGTCATCC TGGCCGCGCT GCTGCCTATC 
GGCACCGGGC TCCAGCTGCT GGTCGGCATC GCCGGCGTCT CCGCCTTCGG CGCAGCCAGC 
CTGCCCATGC TGCGCCAACT CCGCGGTGCG CGCGACCAGG CCCGCGCCTT GCTCGACGAC 
CCACTCAGCG AGGAGATCTA CCTCGGGCGC CGCGACCACG GCGCCTCGAT CCAGCTGGCC 
CTGATCCACC AGGCCTCCGA GACCCAGGCC ATCGCCAAAC GCCTGGGTGA CGACGCCCGT 
CAGCTGTCCC AGGAGGCCGC CGGGGCCCGC CAGTCGATGC AGGCGGTACG CGACGAGGCG 
CAGCAGCAGA GCGACGAGAC CCGCAGCGTG GCCACCGCCA TGGAACAGAT GAGCTCCACG 
GTGCAGGAAG TGGCCCAGAA CGCCTCGGCC ACCGCCGATG CCACCGAGCG GGCTGGCAAG 
CAGACCGACC GGGGTCGGCA GACCGTCGAG CAGAGCACCG CTGCGGTGCG CTCACTGGTC 
CAGGGCATCG AGAACGCCGC GACCACCATC GAGCGGGTCA ACGGCGAGGC CGAGCGCATC 
GGCAAGGCGG CCACGCTCAT CGGCAAGATC ACCAAGCAGA CCCACCTTCT GGCCCTCAAC 
GCCTCGGTCG AGTCGGCGCG GGCTGGCGAG GCGGGACGCA GCTTCACCGT CGTGGCCGAG 
GAGGTGCGCA AGCTGGCCGG GCAGACCGCG GAATCGACCC GCGAGATCGA TGCCATCATC 
GAGTCGCTAC AGAGCGGCTC AGCGGAGGCC GTCGAAGCCA TGCGCGAGAG CCGCAACCGT 
GCCGAGCAGA CCCTCGCCCA CGCCGACGAG TCCAGCCAGT CGCTGCAGGA GATCCAGGCC 
GCGGTGGACG AGATCCGCGA TATGGCCGGC CAGATCGCCA CCGCCACCGA GCAGCAGGGG 
GCCACCTCGC AGGAGATCGC GCGCAGCGTC TCCAGCATCG AGGGGGTGGC CGAACGGGTG 
ACCAGCGAGT CGTTGCAAAC CGACCAGCGC CTACAGGCGG TCATCGAGCG CATCGCCGGC 
ATCGAGGCCC TGACCGGTCG ATTCGTGCGT CGCCGCTGA

Protein sequence

MRVNDPVTQR RVAVWDGANI LSTTDSRGRI RYINEDFVRI SGYQPEELIG QPHNVIRHPD 
MPRVVFEHMW QRLQAGQPWM GIIKNRCKNG DHYWVHAYAT AIRDDAGNIT EIQSVRQQIN 
DEAVVARAER AYKRLRAAEP DKGALPAGLI GRRAVGSGVW LAAGGTAALL GVILAALLPI 
GTGLQLLVGI AGVSAFGAAS LPMLRQLRGA RDQARALLDD PLSEEIYLGR RDHGASIQLA 
LIHQASETQA IAKRLGDDAR QLSQEAAGAR QSMQAVRDEA QQQSDETRSV ATAMEQMSST 
VQEVAQNASA TADATERAGK QTDRGRQTVE QSTAAVRSLV QGIENAATTI ERVNGEAERI 
GKAATLIGKI TKQTHLLALN ASVESARAGE AGRSFTVVAE EVRKLAGQTA ESTREIDAII 
ESLQSGSAEA VEAMRESRNR AEQTLAHADE SSQSLQEIQA AVDEIRDMAG QIATATEQQG 
ATSQEIARSV SSIEGVAERV TSESLQTDQR LQAVIERIAG IEALTGRFVR RR