Gene Hhal_1725 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1725
Symbol
ID	4710553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	1892127
End bp	1893653
Gene Length	1527 bp
Protein Length	508 aa
Translation table	11
GC content	68%
IMG OID	639856193
Product	hypothetical protein
Protein accession	YP_001003291
Protein GI	121998504
COG category	[R] General function prediction only [S] Function unknown
COG ID	[COG0645] Predicted kinase [COG2187] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACGGATC GGATCCCTGA CCTGGAGGCC CACCGGGCCC TGGCCGAGGC ACTCCAGGCC 
CCGGAGTGCT ACCCGTGGCC GGTGGACACT GTCGAGTGTA TCGAGACCCA CATCTCCACG 
GTGCTGCTCG CCGGGGCGTA CGTGGTCAAG CTCAAGAAAC CGCTGGACCT CGGCTTCCTG 
GACTTCTCCA GCCTGGAGCG GCGACGCTAC TTCTGCGACG AAGAGGTTCG CCTCAACGGC 
CGCTTGGCTC CGCAGATCTA CCTGCGCCGA GTGGCAATCG CCGGTCCGGC GACGGAGCCG 
CGCATCGACG GCGAAGGGGA CGTGCTGGAG TACGCGGTGC TCATGCGCCG CTTCCCCGAG 
AATGAGCTCA TGAGCCGTCT GCTGCGCGAG GGGCGTCTGC CCCATGGAGC CGTCGAGCGC 
CTGGCTGAGA CTGTGGCGCG GTTCCATGCC GGGCTGCCGG CCGCCGGGGA GGATAGTGAA 
TACGGGTCGC CGGAGGCCGT GGCCGATCCC ATGCGTGACA ACTTCCGCGC CCTGGAGACC 
CAGTCCGCGG CCGCCTCGAT GCGCGGCGAA CTGCGTGCCC TGGAGCGCTG GACCGAGGCA 
CAGCTGCAGC GGCTGGAGCC GCTGATCCGC CGGCGACGCG CCGAGGGCGC GGTGCGTGAA 
TGCCACGGGG ACCTGCACTT GGGCAATGTC GCCTGGCATG AGGACGACCT GATCATCTTT 
GATGGCATCG AGTTCAATCC GGCACTGCGC TGGATCGACA CGGCCAGCGA GGTCGCCTTC 
ACCGTTATGG ATCTGGATTT TGAAGGGGCC CGTCGGCTTC GCCACTGCTT CCTGGACCGC 
TACCTGGAGC AGAGTGGCGA CTACCAGGCG CTGCCGCTGC TGCCCCTGTA CGCCGTGTAT 
CGGGCCCTGG TGCGGGCCAA GATCAACGGC CACGAGGTCG AACAGGGGGG TGGCAGTGCA 
GCCCAGGAGG CGCTCTGCGA CCACGTCCAA CTGGCCAAGA GCTATACGGT GGCGCAGGTG 
CCGGAGTTGG TCATTACCTA CGGGTTATCG GGATCCGGCA AGAGCGTACG CGCCCGCCGA 
CTGGTCGAGG AGCGCGGGTT TATCCGGCTG CGATCGGATG TCGAGCGCAA GCGGCTGTTC 
GGTTTGGAGC CCCGCGCGCG CTCGGACTCG ACCCTGGATA GCGGGCTCTA TTCGCCGGAG 
GCAACGTGGC GGACTTACGA ACGACTGCAG GAGCAGGCCG AGGGCGCCCT GGAAGCCGGC 
TTTTCGGTGG TGGTGGATGC CGCCTTCCTC AAGGCCGAGC GACGCCGGCC GTTCCTGGAG 
CTGGCTGCGC GCACCGGATG TCGATTTCGG ATCCTGCATG TTCGGGCCGA CGAACAGACC 
CTGCGGGAAC GCCTGCGCAA GCGGCTGGCC GAGGGGCGCG ATCCCTCCGA GGCCGATGAG 
ACGGTGCTCG ATGCTCAGCT GCGTACAGCG CAACCGCCGT CCGGCGAGGA AGCGGCTTTC 
GTCGAAACCG TCGACGCGGA CGGGTAA

Protein sequence

MTDRIPDLEA HRALAEALQA PECYPWPVDT VECIETHIST VLLAGAYVVK LKKPLDLGFL 
DFSSLERRRY FCDEEVRLNG RLAPQIYLRR VAIAGPATEP RIDGEGDVLE YAVLMRRFPE 
NELMSRLLRE GRLPHGAVER LAETVARFHA GLPAAGEDSE YGSPEAVADP MRDNFRALET 
QSAAASMRGE LRALERWTEA QLQRLEPLIR RRRAEGAVRE CHGDLHLGNV AWHEDDLIIF 
DGIEFNPALR WIDTASEVAF TVMDLDFEGA RRLRHCFLDR YLEQSGDYQA LPLLPLYAVY 
RALVRAKING HEVEQGGGSA AQEALCDHVQ LAKSYTVAQV PELVITYGLS GSGKSVRARR 
LVEERGFIRL RSDVERKRLF GLEPRARSDS TLDSGLYSPE ATWRTYERLQ EQAEGALEAG 
FSVVVDAAFL KAERRRPFLE LAARTGCRFR ILHVRADEQT LRERLRKRLA EGRDPSEADE 
TVLDAQLRTA QPPSGEEAAF VETVDADG