Gene Hneap_2353 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hneap_2353
Symbol
ID	8535517
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothiobacillus neapolitanus c2
Kingdom	Bacteria
Replicon accession	NC_013422
Strand	+
Start bp	2519937
End bp	2521277
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	55%
IMG OID	646384727
Product	carboxyl-terminal protease
Protein accession	YP_003264209
Protein GI	261856926
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0201351
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTCAGT GGTTACGTAA AACATCTGCC CTTGGCGTTG CCGCCGTTTT CGGGTTCTCT 
GTGGCGATTG CCGTTAACGC GCTTGCTGAC AAGGATCAGG CCACTGATTC CAACATTCCG 
CTGAGCGAAT TGCGCACATT CACCGATGTT TTAACACGCG TAAAAGCGGA CTATGTCGAC 
AATGTCACCG ACAAGACCCT GATGGACAAT GCCATTCGCG GCATGATCGA TCGCCTCGAC 
CCGCATTCGA ATTATCTCGA TAAGGCCGAG TTCAAGGATC TGCGGGAAAC CACAACCGGC 
AAATTCGGTG GCTTGGGATT ACAGGTCGGC ATGAAGGACA AGGTGATCAC CGTCATCTCG 
CCAATCGACG ACACCCCGGC CCAAAAAGCT GGTATTAAGG CCGGCGACAG GATCGTCAAG 
ATCAATGGTG AGTTCACCCA GGGTCTTGAC CTTGAGAAAG CAGTAAAACA GATGCGCGGC 
GACCCGGGCA CGAAAATCAC GCTGACACTG GTTCGCGATG GCGTCGACAA ACCGTTTGAC 
GTCACACTTG AGCGCGCCAT CATCAACGTC AAGTCGGTCA AGGCGCGCAT GCTTGATCCG 
AACTTCGGCT ATGTGCGCAT CGCCCAATTC CAGTCCGACA CGACAGAACA GTTGCATGAT 
GCGCTCAATC AACTGATCAA GGACAACGAC AACAAGCCAC TCAAAGGCTT GGTACTTGAT 
CTGCGCAACA ATCCCGGCGG CGTGCTTCAG GCAGCAGTCG GCGTGGTGGA TACCTTCGTC 
AACAAGGGTT TGATCGTATA TACCAAGGGT CGTGTCGAAG ATGCGCAGAT GAGCTTCAAG 
GCGCATGAGG GCGACATGCT CAACGGCGCC CCCATCGTGG TGTTGGTGAA CGGCGGCTCG 
GCGTCAGCAT CGGAAATCGT TGCCGGTGCT CTGCAAGATG ACAGCCGGGC ATTGATTGCC 
GGTGAACGCA CCTTCGGCAA GGGCTCGGTT CAGTCCATCA TGCCATTGAC CAATGGCGGG 
GCGCTGCGCC TGACCACGGC CCGCTACTTC ACGCCCTCGG GCCGCTCAAT TCAGGGCGAG 
GGCATCAAGC CGGACGTGGA AGTGCATCAG TTGAAAGTTA CCGATATCGA CAAGGTGTTC 
TCCATCAAGG AAGCTGATCT GGCCGGTCAC ATCAGCAACC CCACCAAGCC AGATCAAAAA 
CCGGCTACCC AGCCGATCAA GCAAATGATC GACTCCGACG GTAAGCCGTT GGTAGAAACC 
GATTATCAGC TCTACGAGGC ACTCAATCTA CTCAAGGGCA TGTCCATCGT GGCGCATCGA 
GATCGGGATT CCGCACAGTA A

Protein sequence

MAQWLRKTSA LGVAAVFGFS VAIAVNALAD KDQATDSNIP LSELRTFTDV LTRVKADYVD 
NVTDKTLMDN AIRGMIDRLD PHSNYLDKAE FKDLRETTTG KFGGLGLQVG MKDKVITVIS 
PIDDTPAQKA GIKAGDRIVK INGEFTQGLD LEKAVKQMRG DPGTKITLTL VRDGVDKPFD 
VTLERAIINV KSVKARMLDP NFGYVRIAQF QSDTTEQLHD ALNQLIKDND NKPLKGLVLD 
LRNNPGGVLQ AAVGVVDTFV NKGLIVYTKG RVEDAQMSFK AHEGDMLNGA PIVVLVNGGS 
ASASEIVAGA LQDDSRALIA GERTFGKGSV QSIMPLTNGG ALRLTTARYF TPSGRSIQGE 
GIKPDVEVHQ LKVTDIDKVF SIKEADLAGH ISNPTKPDQK PATQPIKQMI DSDGKPLVET 
DYQLYEALNL LKGMSIVAHR DRDSAQ