Gene Hhal_2327 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_2327
Symbol
ID	4709284
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	2553537
End bp	2554544
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	73%
IMG OID	639856802
Product	putative DNA-binding/iron metalloprotein/AP endonuclease
Protein accession	YP_001003892
Protein GI	121999105
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0533] Metal-dependent proteases with possible chaperone activity
TIGRFAM ID	[TIGR00329] metallohydrolase, glycoprotease/Kae1 family

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCGTGTAC TAGGCATCGA GAGTTCCTGT GACGAGACCG CGGCCGCCGT CTACTGTGGT 
CGTGATGGCC TGTTGGCCCA CGCGGTGCAC AGTCAGGTGG CCGATCACGC CGCTTACGGC 
GGCGTGGTGC CGGAGCTGGC CTCACGGGAT CACGTGCGCA AGCTGCCCGG TCTGGTCGGT 
GGGGTGTTGC GGGATGCCGG CCTGACGCCG GCAGATCTCG ACGGCGTCGC CTGGACCCGC 
GGCCCAGGGC TCCCCGGGGC CTTGATGGTC GGGGCCGGGT TCGCGCGCAC CTTCGCCTGG 
GCGCGGGGGC TGCCGGCGGT CGGGGTGCAC CACATGGAGG GGCACCTGCT GGCGCCCCTG 
CTCGAGCCCG ACCCGCCGGC CATGCCCCTG GTGGCCCTGC TGGTCTCCGG CGGGCATACG 
ATGCTGGTGC AGGTGGCCGA CTTCGGCCGC TACCGGGTCC TGGGGGAGTC GGTGGATGAC 
GCCGCCGGCG AGGCCTTCGA CAAGACGGCT CGGCTGCTGG GGCTGCCGTA CCCGGGGGGG 
CCGGCCATCG CCCGCCTCGC CGTCGAGGGA ACACCGGGGG CGGTGCGCCT GCCGCGGCCG 
ATGACCGACC GGCCGGGGCT GGACTTCAGC TTCAGCGGCC TGAAGACGGC GGTCCTCCAC 
GCCGTCGAGG CGGCGGGGAA CGATCAGCAG GCCCGGGCGG ACATCGCCCA CGGATTCCAG 
GAGGCGGTGG TGGATACCCT GGTGATCAAG TGCCGGCGTG CCATCGAGCA GACGGGCGCG 
GGCCGGCTCG TGGTCTCCGG CGGGGTGGGC GCCAACGCCC GGTTGCGCGA ACGCCTGGAT 
GAGGTGGGGC GGGCGAGCGG CTTCACCGCC CACTACCCGC GCCTGGAGCT GTGTACCGAC 
AACGCTGCGA TGATCGCCTA CGCCGGCCTG CGTCGGCTGG AGGCGGGCTA CCGCGACGAT 
CTCGACTTCA GCGTACGCCC CCGCTGGCCG TTGGCCGAGC TCAGCTAG

Protein sequence

MRVLGIESSC DETAAAVYCG RDGLLAHAVH SQVADHAAYG GVVPELASRD HVRKLPGLVG 
GVLRDAGLTP ADLDGVAWTR GPGLPGALMV GAGFARTFAW ARGLPAVGVH HMEGHLLAPL 
LEPDPPAMPL VALLVSGGHT MLVQVADFGR YRVLGESVDD AAGEAFDKTA RLLGLPYPGG 
PAIARLAVEG TPGAVRLPRP MTDRPGLDFS FSGLKTAVLH AVEAAGNDQQ ARADIAHGFQ 
EAVVDTLVIK CRRAIEQTGA GRLVVSGGVG ANARLRERLD EVGRASGFTA HYPRLELCTD 
NAAMIAYAGL RRLEAGYRDD LDFSVRPRWP LAELS