Gene Hhal_1770 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1770
Symbol
ID	4710967
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	1943243
End bp	1945198
Gene Length	1956 bp
Protein Length	651 aa
Translation table	11
GC content	64%
IMG OID	639856240
Product	ATP-dependent metalloprotease FtsH
Protein accession	YP_001003336
Protein GI	121998549
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0465] ATP-dependent Zn proteases
TIGRFAM ID	[TIGR01241] ATP-dependent metalloprotease FtsH

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.292571
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCGACA TGGCCAAGAA TTTGATCCTT TGGGTCATCA TCGCCGTCGT GCTGATGTCC 
GTATTCAGCA ACTTCCAGGA ACAATCGGCG GATGTGACCG AGAAGGTTCC CTACTCGGAG 
TTCCTCAACG AGGTCGAGCG GGGGAACATC CGCGAGGTGC TGATCCGGGG TGAGGAGATC 
ACCATCCAGC ACGCCGACGG CAACGAGTAC CGGACCTTCA ACCCGGAGGT CGACAACCGC 
GCGCTGATCG GCGAACTGCT TGAGCACGGC GTCACCATCG ATGCCGAGCA GGCTGAAAGC 
GACAGCATGC TCATGCAGAT CCTCATCTCG TGGACGCCCT TCCTGCTGCT GATCGCCGTG 
TGGATCTACT TCATGCGCCA GATGCAGGGA GGCGGCGGTG GCCGCGGGGC GATGTCCTTT 
GGCAAGAGCA AGGCCAAGAT GATGACCGAG GAGCAGAGCA AGCACAGCTT CTCGGACGTG 
GCCGGTTGCG ATGAGGCCAA GGAGGACGTC AAGGAACTGG TGGACTTCCT GCGTGACCCG 
AGCAAATTCC AAAAGCTTGG CGGGACGATC CCGCGGGGCG TGCTCATGGT GGGTCCTCCG 
GGAACCGGCA AGACCCTGCT CGCCAAGGCG ATCGCCGGGG AGGCCCGGGT GCCGTTCTTC 
TCGATCTCCG GTTCGGACTT CGTCGAGATG TTCGTCGGTG TCGGCGCCTC GCGGGTTCGC 
GACATGTTCC AGCAGGCGAA GAAGCAGGCC CCGTGCATCA TCTTCATCGA CGAGCTCGAC 
GCCGTGGGGC GGCAGCGTGG GGCCGGTCTC GGCGGTGGGC ACGATGAGCG CGAGCAGACG 
CTGAACCAGA TGCTCGTCGA GATGGATGGA TTCGAGGGCA GTGAAGGGAT CATCGTCATC 
GCTGCCACCA ACCGTCCCGA CGTCCTCGAC CCGGCGCTGC TGCGTCCGGG GCGCTTCGAC 
CGTCAGGTGG TGGTGCCGCT GCCCGATGTC CGAGGGCGTG AGCAGATCCT CAACGTGCAC 
ATGCGCAAGG TACCGACGGC GGACGATGTC CGGCCCGAGA TCATCGCCCG CGGGACGCCG 
GGCTTCTCCG GCGCCGACCT GCAGAACCTG GTCAATGAGG CAGCGCTGTT CGCGGCCCGA 
GCCAACAAGG AGGCCGTCGA TCAGACGGAC TTCGAGCAGG CCAAGGACAA GATCATGATG 
GGCTCCGAGC GCAAGTCCAT GGTGATGAAA GAGGACGAGA AGAAGCTCAC GGCCTACCAC 
GAGGCCGGGC ACGCCATCGT CGGCTTGCTC ACCCCGGAGC ACGATCCGGT TCACAAGGTG 
ACGATCATCC CGCGGGGGCG CGCGCTGGGC GTGACCATGT TCCTTCCTGA GGAGGATCGC 
TACAGCTACA CCAAGCAGCG CCTGGACAGC ATGATCGCCA GCCTCTTCGG TGGGCGGATT 
GCCGAGGAGC TGATCTTCGG CAACGACCGG GTCACTACCG GTGCCCAGAA CGACATCCAG 
CGGGCCACCG AGATTGCCCG CAACATGGTC ACCAAGTGGG GGCTTTCGGC GCGGCTCGGT 
CCGCTCGCCT ACGGCGAGGA GGAGGGCGAG GTGTTCCTCG GCCGCTCCAT GGCGCAGCAG 
AAGGACGTCT CCGACGAGAC GCAGCACGCC ATCGACGAAG AAGTGCGCGC AGTGATCGAC 
AACAACTACA CTGCGGCTGA GAAGATCCTC CAGGAGAACC TGGAGAAGCT GCACCTGATG 
GCTGATGCGC TGATGAAGTA CGAGACCATC GACCGCGATC AGATCGACGA CATCATGCGG 
GGCGACGAGC CGCGACCGCC CAAAGGGTGG CAGGATCGGG ATCACGGTGG TGGCTCGGGC 
GACGAGGGTG AGACTGCCGG GGCCGATGAC CAGCCCGAGG CCGAAGGTAA AGACGGCCGC 
GAGGGGCCCA TCGGCGGACC TGTAGGCGAG CACTGA

Protein sequence

MSDMAKNLIL WVIIAVVLMS VFSNFQEQSA DVTEKVPYSE FLNEVERGNI REVLIRGEEI 
TIQHADGNEY RTFNPEVDNR ALIGELLEHG VTIDAEQAES DSMLMQILIS WTPFLLLIAV 
WIYFMRQMQG GGGGRGAMSF GKSKAKMMTE EQSKHSFSDV AGCDEAKEDV KELVDFLRDP 
SKFQKLGGTI PRGVLMVGPP GTGKTLLAKA IAGEARVPFF SISGSDFVEM FVGVGASRVR 
DMFQQAKKQA PCIIFIDELD AVGRQRGAGL GGGHDEREQT LNQMLVEMDG FEGSEGIIVI 
AATNRPDVLD PALLRPGRFD RQVVVPLPDV RGREQILNVH MRKVPTADDV RPEIIARGTP 
GFSGADLQNL VNEAALFAAR ANKEAVDQTD FEQAKDKIMM GSERKSMVMK EDEKKLTAYH 
EAGHAIVGLL TPEHDPVHKV TIIPRGRALG VTMFLPEEDR YSYTKQRLDS MIASLFGGRI 
AEELIFGNDR VTTGAQNDIQ RATEIARNMV TKWGLSARLG PLAYGEEEGE VFLGRSMAQQ 
KDVSDETQHA IDEEVRAVID NNYTAAEKIL QENLEKLHLM ADALMKYETI DRDQIDDIMR 
GDEPRPPKGW QDRDHGGGSG DEGETAGADD QPEAEGKDGR EGPIGGPVGE H