Gene Tpen_0248 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_0248
Symbol
ID	4601475
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	-
Start bp	218299
End bp	219399
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	57%
IMG OID	639773002
Product	peptidase M24
Protein accession	YP_919661
Protein GI	119719166
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATCGACT TTAAGCAGCA CGTGTCCAAA GTGGTTGAAA GGATCCTGGT ACCCAACGAT 
CTTAACTACC TAGTGGTGAT GTCGGCTTCT AACATCTTCT ACCTTTCGGG TAGCGACGCT 
CCTTCCGCGC TTGTCGTGTC TAAAGAAGGA GAGGTCAGCG CGCTCGCCTC CCGCCTCGAG 
TACTTCAGAG CAGTATCCGA GACAAGCGGC TTGCGCGTAG TGGCGTTTGC ACGCGAAGGG 
GAAGACGTTA GCGAGTACGA GGAGGTTGTA CGGGGTGACT TCTACGAGGC GCTTTCACGA 
ATGGTGTCCG GCAGCGAAAG GATCGGCGTT GTAGGGGCTT CCTGCGAGGC AAAGGAAAAG 
CTGGCGGAGA AGACAGGGAA GCAGCTATAC GACTACTCCA AGGAGTTCTC CCTCATAAGG 
CGCGTGAAAG ACCCCGGGGA GCTCGAAGCA ATAAACAGAG CTGCTCGGCT CGCAGAGCTG 
GCTATGAGGA AGGCTCTAGA CACGCTGGAG CCAGGGGTCA CCGAGTCGGA GGTTGCCTCC 
GAGATCCTGA AGGTCATAGT CTCCTCCGGT GCATATCCGT CGTTCCCACC CATAGTGGCC 
TTCGGGGAGC ACGCGGCTCA CCCGCACGCG AAGCCTAGCC TGAGGAGGCT TATAAAAGGC 
GACTTCGTAA AGATAGACCT GGGAGCTAAG GTTGACGGCT ACTGCTCGGA CATGACCAGA 
ACCCTGGTCT TCGGCGAGCC GTCTGAGAAG CAGCGAAGAA TATTCGAGGC GGTGGTTAAA 
GCTCAGGAAA GCGCGCTCGC CTCTATTAAG GCGGGCGTAC AAGCCCGGGA AGTACACGCA 
ATAGCCCTCA GAGCCTTGAA GGAAGCGGGG CTTTCACAGT ACTTTAATCA CGGCCTGGGG 
CACGGCGTCG GCGTCGATAT ACACGAGGAA CCGTACCTTA ACCTTCAGAG CGAAGCTGTG 
CTCCTCGAAG GAGACGTAGT TACGGTTGAG CCGGGAGTCT ACCTGCCCGG CTACGGCGGA 
GTACGCATAG AGGACATGGT GTACGTGGAG AGGGGCGGAG GACGCCTGCT GACATTCTTC 
AGCAAAGACA TGGTGGTTTA G

Protein sequence

MIDFKQHVSK VVERILVPND LNYLVVMSAS NIFYLSGSDA PSALVVSKEG EVSALASRLE 
YFRAVSETSG LRVVAFAREG EDVSEYEEVV RGDFYEALSR MVSGSERIGV VGASCEAKEK 
LAEKTGKQLY DYSKEFSLIR RVKDPGELEA INRAARLAEL AMRKALDTLE PGVTESEVAS 
EILKVIVSSG AYPSFPPIVA FGEHAAHPHA KPSLRRLIKG DFVKIDLGAK VDGYCSDMTR 
TLVFGEPSEK QRRIFEAVVK AQESALASIK AGVQAREVHA IALRALKEAG LSQYFNHGLG 
HGVGVDIHEE PYLNLQSEAV LLEGDVVTVE PGVYLPGYGG VRIEDMVYVE RGGGRLLTFF 
SKDMVV