Gene Hhal_1210 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1210
Symbol
ID	4710236
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	1314209
End bp	1315456
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	69%
IMG OID	639855683
Product	carboxyl-terminal protease
Protein accession	YP_001002787
Protein GI	121998000
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAATCCT GGAGCCTGAC CCTGGCCGCC GCCCTGCTTG CGCTGTTCGT CGGCCCGGCC 
GTCGCCGATT CGCCGGCGGA GGCCGAAGAC GACCTGCCCA TGGCGGAGCT GGAGCTGCTG 
AGCGAGGTCT ACAGTCGGAT CAAGCGGGAC TACGTGGATG AGGTGGATGA CGCGGATCTG 
TTCCGGGCGG CGATCCGCGG GATGCTCTCG GAGCTGGATG CCCACTCGAG CTACCTCGAC 
GAGGATGAAC TCGAGCAGCT GCGCGAGGGC ACCCGTGGCG AGTTCGGCGG CGTGGGCTTG 
GAGCTGAGCC GCCAGGACGA CGAAATCCGC GTGGTCGCGC CCATCGATGA CACCCCGGCC 
AGCCGGGCGG GGTTGCAGGC CGGTGACGTC CTCCTGCGCA TCGACGGCGA CACCGTGCGG 
GGGGCCAGCC TCAACGAGGT GGTGCAGCGC CTGCGCGGTG AGCCGGGCAG CGTCGTCGAG 
GTGACCATCA GACGAACGGA GGACGAGGGC CGGACCCGTA CCCTCGAACT CGAGCGCGAC 
ACCATCCAGG TGGAGAGCGT GCGCGCCCGG ATGCTCGAGC CGGGTTACGG CTACGTGCGT 
ATCAGCCAGT TCCAGGAGCG CACCGCCAGC GACCTCTACC CCGCCCTGGA CCGCCTGCTC 
GAAGAGGCCG ATGGTGCCCT CGACGGCCTT ATCCTCGATC TGCGCAACAA CCCGGGCGGG 
GTCCTCGATC CGGCCGTGGC GGTGGCGGAC GCCTTCCTGA CCGAGGGCCG GATCGTCTAC 
ACCGAGGGGC GCATGCGTCA GGCGCGCATG AGCTTCGACG CCACTCCGGT GGATCGGGCC 
CGAGGTGCGC CGATGGTGGT GCTGATCAAT CGGGGCTCGG CTTCGGGCTC CGAGATCGTC 
GCCGGGGCCC TGCAGGATCA CCGGCGTGCC GTGATCATGG GTCGGGCCAG CTTCGGCAAG 
GGGTCGGTGC AGAGTGTGTT GCCCCTCGAC GGGGCCGCCA TGAAGCTGAC CACCGCCCGG 
TACTACACGC CCGATGGGCG CTCGATCCAG GACGAGGGGA TCCAGCCGGA TATTGTCGTC 
GACAATCTGC GTCTGACGGA GACCGAAGAC CGCGGGGCGG AGGGGGTCCT GGATGCGCCC 
GAGGATGCCG AGGACGCCGA AGAGGCGGCG GAGCTGGCCA AGGATGACTA TGTGCTCAGC 
GAGGCGCTCA ACCTGCTCAA GGGGCTGCGC GTGTTCGAGG GGCGCTGA

Protein sequence

MQSWSLTLAA ALLALFVGPA VADSPAEAED DLPMAELELL SEVYSRIKRD YVDEVDDADL 
FRAAIRGMLS ELDAHSSYLD EDELEQLREG TRGEFGGVGL ELSRQDDEIR VVAPIDDTPA 
SRAGLQAGDV LLRIDGDTVR GASLNEVVQR LRGEPGSVVE VTIRRTEDEG RTRTLELERD 
TIQVESVRAR MLEPGYGYVR ISQFQERTAS DLYPALDRLL EEADGALDGL ILDLRNNPGG 
VLDPAVAVAD AFLTEGRIVY TEGRMRQARM SFDATPVDRA RGAPMVVLIN RGSASGSEIV 
AGALQDHRRA VIMGRASFGK GSVQSVLPLD GAAMKLTTAR YYTPDGRSIQ DEGIQPDIVV 
DNLRLTETED RGAEGVLDAP EDAEDAEEAA ELAKDDYVLS EALNLLKGLR VFEGR