Gene Hhal_1783 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1783
Symbol
ID	4710892
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	1956984
End bp	1958456
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	67%
IMG OID	639856253
Product	hypothetical protein
Protein accession	YP_001003349
Protein GI	121998562
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1030] Membrane-bound serine protease (ClpP class)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTGGATTC GACGTCTGCT CGCCGTCCTT CTTGCCTACT TCCTCTCGGC GGTCCCGCTG 
GGTAGTGCCG AGACGCCTCC GGACGCCGGC GAAGATGCCG CCGGCACTGC GCTGATGCTT 
GACGTCAAGG GGGCCATCGG TCCGGCCACC ACCGACTACA TCGTGCGCGG CCTGGCCGAG 
GCTCAGGAAC GGGGCGCCGG TCTGGTCATC CTGCGCATGA ACACGCCCGG TGGTCTCGAC 
GATGCCATGC GGGACATCAT CAGCGAGATC CTCGCCAGCG ACGTCCCTGT GGCCACCTAC 
GTCGCGCCCA GCGGTTCCCG CGCGGCGAGT GCCGGGACCT ATATCCTCTA TGCCTCGCAC 
GTGGCCGCCA TGGCGCCGGC GACCAACCTC GGTGCGGCCA CTCCGGTGCA GATCGGCGGG 
GGAGGCGGTG GGATCTTCCC CGGTGGCGAT GACGAGGAGC AGGGAGGCGA CGCCCTGGAG 
GAGCTCCGGG AGCGGCTCGG CGGCGAGGAG GAAGACGTCG ACGAGGAGGC GCGTGAGGAA 
GACGAGGCGG TCGAGCAGGA AGAGCCGGCG GAAGAGCGGG CCGACCGCCC GGACGCGATG 
GAGCGCAAGA TCATCGAGGA TGCGGTCTCC TACATCAAGG GGCTGGCCGA GCTGCGCGGG 
CGCAATGCCG AGTGGGCCGA GAGGGCAGTG CGCGAATCGA TCAGCGCCTC GGCGAGCGAG 
GCGGCGGAGC TGGGGGTGAT CGACTTCGTC GCCGAGGACG TGGATGAGCT CCTGGCCAAG 
GCCGATGGCG TGGTGGTCAA GCTCCCCGGG GGCGAGCGGG CCATCGAGAG CGCCGGACTG 
GAGGTGGATC TGGTCGAACC GGACTGGCGC AATCGGCTGC TTTCGGTGAT CACCAACCCG 
AACGTGGCCT ACATCCTGAT GCTGGTGGGC ATCTACGGCA TCATCTTCGA ACTGATCAAT 
CCCGGTTCCC TGGTGCCTGG TGTCCTCGGT GGCATCAGTC TGCTGCTGGC CCTGTACGCC 
TTCCAGGCGT TGCCGATCAC CTACGCCGGC CTGGGGCTGA TCGGGCTGGG GATCGCCTTC 
ATGATCGCCG AGGCGTTCAT GCCCAGTTTC GGGATCATGG GCATTGGCGG TGCCGTCGCC 
TTCGTCCTCG GCTCGATCAT GCTGTTCGAC ACCGATCTTG AGGCCTTCCA GGTCTCGCTT 
GGGGTGATCG CCGGGTTTAC CGTGGCCAGT CTGATCATCT TCATCGGCGT GGCGATGATG 
GCCGCCCGGG CCTGGCAACG ACCCAAACTC GGCGGGGCTG ATGAACTCAT CGATGCCGAG 
GCCATCGCCG AGGAGAGTTT CGAGGGGGCT GGCCACGTGC GTTACGCCGG CGAGCGCTGG 
AATGCCGTGG CGGTGAGCCC GGTGCGTAGC GGCGAGCGGG TGCGCGTGGT CAGTAAGGAA 
GGACTGACAC TGAAGGTGGA GCCCAATGAC TGA

Protein sequence

MWIRRLLAVL LAYFLSAVPL GSAETPPDAG EDAAGTALML DVKGAIGPAT TDYIVRGLAE 
AQERGAGLVI LRMNTPGGLD DAMRDIISEI LASDVPVATY VAPSGSRAAS AGTYILYASH 
VAAMAPATNL GAATPVQIGG GGGGIFPGGD DEEQGGDALE ELRERLGGEE EDVDEEAREE 
DEAVEQEEPA EERADRPDAM ERKIIEDAVS YIKGLAELRG RNAEWAERAV RESISASASE 
AAELGVIDFV AEDVDELLAK ADGVVVKLPG GERAIESAGL EVDLVEPDWR NRLLSVITNP 
NVAYILMLVG IYGIIFELIN PGSLVPGVLG GISLLLALYA FQALPITYAG LGLIGLGIAF 
MIAEAFMPSF GIMGIGGAVA FVLGSIMLFD TDLEAFQVSL GVIAGFTVAS LIIFIGVAMM 
AARAWQRPKL GGADELIDAE AIAEESFEGA GHVRYAGERW NAVAVSPVRS GERVRVVSKE 
GLTLKVEPND