Gene Hneap_2201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hneap_2201
Symbol
ID	8535365
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothiobacillus neapolitanus c2
Kingdom	Bacteria
Replicon accession	NC_013422
Strand	+
Start bp	2367217
End bp	2368515
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	59%
IMG OID	646384582
Product	peptidase M24
Protein accession	YP_003264064
Protein GI	261856781
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGACAAC GCGATGACAT GACTTTTCCG ATGGGGGAAT ACACTCGTCG GCTGAACGAA 
TTGCGCACCC GGATGCAGGA ACGATTGCTT GATGCCGTCA TCATCACCGA CCCGGAAAAC 
CTGATGTATC TGACCGATTA TCAGACCACG GGCTATTCCT TTTTCCAGGC GCTGGTCGTG 
CCGCTGGAAG ACGAGCCGTT CATGATCACC CGCAACATGG AAGAATCCAA TGTGATCGCC 
CGTACCTGGG TCGAACTGAC GCGCCCCTTC CCCGATGGGG GCGACGCGAT CCAGATGCTC 
GTTTCCAGCC TCAAGGAATT CGGCCTGTCG CACAAGACGC TGGGTTACGA GCGCAACAGC 
TATTTTTTCC CGGCCTACCA ACAGGATTCG CTGCGGACCA GCCTGACCGA TGCCCGATTG 
CAGGACTGCT TTGGCATTGT CGAATGCGGT CGGCGCACCA AATCCAGCGT TGAGATCGAG 
ATCATGCGCA AAGCAGCTAT CGCGACCGAG GCGGGCATGA AAGCCGGGCT TGATGCTTGC 
CGCGCCGGGG TCACCGAAAA CGAAATCGCC GCGGAAATTT CGGCGGCCAT GTTCCGTGCC 
GGTGGCGAAG CGCCTGCGGT GATGCCCTAT GTCACCTCCG GGCCGCGCAC CATGATCGGT 
CATGCCACCT GGGAAGGCCG CGTGGTGCAG CCCGGCGAGC ATGTGTTCAT GGAAGTCGGC 
GGCTGTTACC GGCGCTATCA CACAGCCATG ATGCGCACCG CCGTGCTGGG CGAACCGACC 
GATTACATGA TGCAGGCACA GGAACGAATG AAGCTGGCAC TCGAGCAGGT CAAGGCGCTG 
ATCCGCCCCG GCGTGACGGT TTCCGATGCC GACAACCTCG TGCGCAGCAT CATGACGGTC 
GACGACAAGC ACGGCAAACT CATTACCCGC TCCGGCTATT CGATTGGCAT CGCATTTCCG 
CCGAGCTGGG ACGAGGGCTA CATTTTAAGC CTGATGCACG GCGACAAAAC CGTCCTGCGC 
GAGGGCATGA CCTTCCACAT CATCCCCTGG GCATGGGGCG TGGACGGCGA CAAGACATGC 
GGCATCTCCG ATACCATTTA CATCACCAAG GATGGGTGCG AATCGTTCTT CACGCTGGAT 
CAGGACTTTG TGATCAAACC GGAGGAAGGC AAGAAAGCGC TGCCACCATC GCCGCCACTT 
GAAATCATGG TGCCGCAAAA CGTCACCCCC ATCGCCAGCA AAGAAGGCAA AAACAAGAAG 
AGCCGCTCTA CCGGCAAAAA GGAGCGTGAA GCCGTATGA

Protein sequence

MRQRDDMTFP MGEYTRRLNE LRTRMQERLL DAVIITDPEN LMYLTDYQTT GYSFFQALVV 
PLEDEPFMIT RNMEESNVIA RTWVELTRPF PDGGDAIQML VSSLKEFGLS HKTLGYERNS 
YFFPAYQQDS LRTSLTDARL QDCFGIVECG RRTKSSVEIE IMRKAAIATE AGMKAGLDAC 
RAGVTENEIA AEISAAMFRA GGEAPAVMPY VTSGPRTMIG HATWEGRVVQ PGEHVFMEVG 
GCYRRYHTAM MRTAVLGEPT DYMMQAQERM KLALEQVKAL IRPGVTVSDA DNLVRSIMTV 
DDKHGKLITR SGYSIGIAFP PSWDEGYILS LMHGDKTVLR EGMTFHIIPW AWGVDGDKTC 
GISDTIYITK DGCESFFTLD QDFVIKPEEG KKALPPSPPL EIMVPQNVTP IASKEGKNKK 
SRSTGKKERE AV