Gene Hneap_1884 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hneap_1884
Symbol
ID	8535042
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothiobacillus neapolitanus c2
Kingdom	Bacteria
Replicon accession	NC_013422
Strand	-
Start bp	2019590
End bp	2020603
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	59%
IMG OID	646384265
Product	metalloendopeptidase, glycoprotease family
Protein accession	YP_003263753
Protein GI	261856470
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0533] Metal-dependent proteases with possible chaperone activity
TIGRFAM ID	[TIGR00329] metallohydrolase, glycoprotease/Kae1 family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.635445
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGGTAT TGGGCATCGA AACATCGTGC GATGAAACGG CCATCGCCAT TTATGACACG 
ACCCGCGGTC TGCTCGCGAA TCAGATTCAC TCGCAAACCG ATGTGCATGC ATGCTATGGC 
GGTGTCGTAC CTGAGTTGGC TGCCCGCGAT CACGTACGCA AGTTGCCGTT ATTGTTCAGG 
GCGGCACTGA TTGAGGCGAA TCTTCGCCGC GATCAGATCA ATGCAATCGG ATACACGGCC 
GGTCCCGGTT TGCAGGGCGC ACTGATGACT GGTGCCGCCT TCGCCAAGGG GTTGGCTCGG 
GCGCTTCAAT GCCCTGCGCT GGGTGTCCAT CATCTGGAAG GTCACGTGCT GGCGCCACTG 
CTTGAGGAAG AACGCCCGCA ATTCCCGTTT CTGGCTGTGT TGGTGTCCGG TGGGCACACA 
CAGTTGATTG CAGTCAAAGC GCTGGGAGAC TACGCGCTGC TCGGGGAAAG TATTGATGAT 
GCCGTGGGCG AGGCTTTCGA TAAATCTGCC AAACTCATGG GTTTGGGTTA TCCCGGAGGG 
GCGGCGCTTT CCCAGTTGGC GCAGCGCGGA CGTCGTGATG CCATCCGCTT CCCCCGACCG 
ATGATCGATC GACCGGGATT GGATTTCAGT TTCAGTGGTC TGAAGACGGC GGTGGCATTG 
GCCATCGCTG CGGGCAAAGA TCACGCCGAT ATCGCCGCTT CATTCGAACA GGCCGTCATC 
GATACACTCG CAATCAAAAT CGGGCGGGCA CTGGAGCAGA CCGGTTACCG CCACGTGGTG 
CTGGCTGGCG GGGTTGCGGC GAATCGTCCT TTGCGGTTGC GACTCAAAGA AATGATGGAT 
GAGCGTGGCG GGCAGGTGTT CTACCCACCG CCCATACTGT GTACCGACAA TGCGGCCATG 
ATCGCTTTGG TTGCCGCGCT TCGGTTGGAG CGGGGCGAGC GTGATGCAGC GGCGGGGTTC 
GAGGTTCGTC CTCGCTGGCC ATTGGTTTCC TTGAGCCATT TGTCGTCGCG GTGA

Protein sequence

MRVLGIETSC DETAIAIYDT TRGLLANQIH SQTDVHACYG GVVPELAARD HVRKLPLLFR 
AALIEANLRR DQINAIGYTA GPGLQGALMT GAAFAKGLAR ALQCPALGVH HLEGHVLAPL 
LEEERPQFPF LAVLVSGGHT QLIAVKALGD YALLGESIDD AVGEAFDKSA KLMGLGYPGG 
AALSQLAQRG RRDAIRFPRP MIDRPGLDFS FSGLKTAVAL AIAAGKDHAD IAASFEQAVI 
DTLAIKIGRA LEQTGYRHVV LAGGVAANRP LRLRLKEMMD ERGGQVFYPP PILCTDNAAM 
IALVAALRLE RGERDAAAGF EVRPRWPLVS LSHLSSR