Gene Tpen_0551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_0551
Symbol
ID	4600515
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	+
Start bp	499337
End bp	500755
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	56%
IMG OID	639773322
Product	hypothetical protein
Protein accession	YP_919960
Protein GI	119719465
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGAAG TAGTAATGAG GGGGGATGGA GCGGGGGAGG GGGTTGAAGA GTTCGACGAG 
TGGTTTATTC GCAGGAAGAT CGAGGAGCTC CTGAGGAAGG CGCTGTTTCC GCCCAGCGGC 
TATAGGGGTC TAAAGGCTAC GCACAGCAAG GTTGCACGGG AGCTAGCAGA AATAAAGGCC 
AACTATGTGC AATACGGCGA GGCCTACGTC GAGCACGTCG ACAGGCTCAG GGAAGGCGAG 
GAGAAGGCCT ACAGAGAGGC GGAGAAAGCG ATGCAAGAAG CCTTAGAGCA CGCAGACGAA 
CTCGAAATCA AGAGAACAGG GAAGACGACG TGGAAGGCTA AGCTCCCAGG CAGGAGATGG 
AGGCTATACG TTTGCAGAAC ACCAACCGGG CACTGGCAGG TCGAGGTCGC CCTTCTCTTC 
AAGGTCGCCG AGCTCAGGCT ATCCGATACA TTAAGGCTTC CGCCTGAGCT ACTCAGAGCG 
GCCCAGGATG GCTGGATTCT TGGCGATGCG TCGTACATCG CAAACAAGAA AGAAGTCAAG 
ATGGGTACAG CGCAGACGTG GCAGGTTGCC TCCTTTCCCG GTTTCTGGCC GGGAAAGGAG 
GTAGTGATCT ACGTTAGAAG CGTAGTGATC CACGAGTCTC ACGTCAGCAT AATGTGGCAA 
GTGAGAGTAC ACGGGGTTCG CGACGTGCCC CGATGGTGGA GGCTAAGGAA GGAGGAGAAG 
CGGAGGATGG CAGTCGCCGA GATTGAGGAG GCAAACAAGG GCAATATAGA TGAGCGAAGA 
GCCGTTCGGA TCGCAACGTA CTACGCCGCA GACGGAAAGT ATCCAGGATC AAACTCGGCC 
CTCCATTATC TGGATTTCGC GGTTGGCCGA AGATCTCGCC GAGTTAGAAC GGAGCAATCC 
GTCAGGGTTG CGAGGCTTCT CTACGAGAAA GTGCCGCAAC TATTAGCATT CATGGTCGCG 
TCGGGTTGCA AGAAAGCAGA GTTCTTAGCG AGCCTGGCAT CCGTGAAGCC GCGACACTAC 
GCGCCTCGCT ACCTGGAGGT GTGCGGTGTT AAAATGAACC TGCGGCTCGC AGGCCCTAAG 
AACCGCCGCT ACCTTATGGC CCAAGTATAC ATCACGCGCA ATAACGAGGA GATGCTTCGC 
GATTTCCCCG AGAGGGCGAG GCGCGAGGGT CTAGAAGTCA GAAGGGTGAA GGTGAGTAAG 
AGGTATTGGG GTTACCGTGC TGGCGAAAAA TCGCTAATGA AGTATGCTGA CCGATATCCG 
CACGTCTACG ACACTTTGAT CGAGTTTGTC CAAGAAGAAC TTCAAGCAAC GCCTCCCGAC 
CACCCCGCCC GCCGAAGCAT AGAGCGCCTC TTGGAACGCC TAAGGAAGGC GAAGGAGGAA 
GCGCTCAAAA AGCTGGGGCA CCAAGACGCT AAAGCATGA

Protein sequence

MNEVVMRGDG AGEGVEEFDE WFIRRKIEEL LRKALFPPSG YRGLKATHSK VARELAEIKA 
NYVQYGEAYV EHVDRLREGE EKAYREAEKA MQEALEHADE LEIKRTGKTT WKAKLPGRRW 
RLYVCRTPTG HWQVEVALLF KVAELRLSDT LRLPPELLRA AQDGWILGDA SYIANKKEVK 
MGTAQTWQVA SFPGFWPGKE VVIYVRSVVI HESHVSIMWQ VRVHGVRDVP RWWRLRKEEK 
RRMAVAEIEE ANKGNIDERR AVRIATYYAA DGKYPGSNSA LHYLDFAVGR RSRRVRTEQS 
VRVARLLYEK VPQLLAFMVA SGCKKAEFLA SLASVKPRHY APRYLEVCGV KMNLRLAGPK 
NRRYLMAQVY ITRNNEEMLR DFPERARREG LEVRRVKVSK RYWGYRAGEK SLMKYADRYP 
HVYDTLIEFV QEELQATPPD HPARRSIERL LERLRKAKEE ALKKLGHQDA KA