Gene Tpen_1498 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_1498
Symbol
ID	4601407
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	-
Start bp	1448655
End bp	1450703
Gene Length	2049 bp
Protein Length	682 aa
Translation table	11
GC content	63%
IMG OID	639774273
Product	hypothetical protein
Protein accession	YP_920898
Protein GI	119720403
COG category	[R] General function prediction only
COG ID	[COG4880] Secreted protein containing C-terminal beta-propeller domain distantly related to WD-40 repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGATAGGA GGATGCTCGT AGCCGTAGTG TTGCTAGCCC TTATCGGCGC GCTCACACCC 
TTCGCGCTCT ACGTAGCGCT GGGGCCCCGC GCGGCCCCCA CGGCTGAGAC TGGCGCCCGG 
GGCCAGCGGC TCCTCGAGTT CTACCCGCTG GGTGGCGAGA CGTTCGCGTC CCTGAAGGAA 
ATCCTGGACT TCGCGGAGTC CAGGTTGAAG GCACTGGAAA CAGCTCGGGC CTACACGGCG 
GGCGCCGTGC TCCCCACCGA AGCTACGCGG GCGGCAACCG CGGAGGTATC GAAGACGAAC 
GTCCAGGTAG TCGGGGTGGA CGAGCCGGAC ATCGTGAAGG CAGGTAGCGG GGTAATAGCT 
GTAGCGAGGG GGTCGGAGGT CTACATCGTG GGGATCGCCG AGAGAAAGGT TCTCGGCAAG 
ATCTCAGCTG GGTCCCAGGT TTTCGGCCTC TTCCTGGAGG GGTCTAGGCT CGCCGTGATA 
ACGTCGACGC CACTGATCAG ACCCCTCGTA GTCCTCCCGG GAGCCGGGAG TCCCCCCTAC 
CTGGGCGGCG TTGCCAACAC GACGCTCCTG GTGTACTCTA TCGAGGATCC GTCTAGCCCC 
AGGCTTCTGT ACTCCTCTTC GGTGTCTGGC TACCCGCTCG GCGCGCGCAT GCTGGGCGGC 
GTGGTGTACA TCCTCACGTC CGCGCCCCTA GAGGTAAAGC TCCCGCTGGT AGACGGCGAG 
CCCATACCGC CAGGCTCGGT CGCGAAGATA GACCCGTCGG CATCCTGGTA CCTGGTGCTC 
CTCTGCATGG ACCTCTCCAC GGGGAAGCAC TCGGCGTACG CGTTCACCTC AGCCCCGAGT 
AGCTGGATCT ACATGGGCGA GAACAGGCTC TACGTCGCGT CCTACCCATC AGTATACGAG 
GAGGCCCTCA AAGAGTTCCT GGAAGCTGTG TCCAAGCGCC TACCCGGCGG CGTCTCCGGC 
AGGGTCTCCG GGCTGGCTTT TCAAGGGTTG CTCGGCGAAG CTCTCAACGC GCTGGAGGAC 
TACCTATCCT CGGTGAGCTA CGATGTAGCG AGGGATATTC TGGAGAAGGC TGCAGCAGAG 
GTCCCGCCGA TACCGGACAA GACGATCTTC AAGGTCTTCG CCGTCAGCGG GCTGAAGGTC 
AGCTACCGGG GCTCCGTCGA GGTACCCGGG AGGGTTCTCG ACCAGTTCTC GATGGAGGAG 
CTCGGCGGCT ACTTCGTCGT AGCCACGACC TCGGGGGAGT GGAGGGTGAG AGCCTCGATT 
GCGAAGACGC TCATTACGCC CCCGAGCCCC CCAAGCCGCA ACGTAACGGT GGAGGTTTGT 
AGCGGTGGCT CGTGCCGCGA AATCGTCGTG CCGATCACAG TGCAACCCAC CTCGCTACGC 
GCCGGCAGGC CTATAGTCTA CGTGGGCGTG GAGCCCGCGG CGGACACCTC TAACAACGTT 
TTCTCCGTAA GCCTAGAGGA CCTGAAGGTC AAGGGCAACC TCACCGGGCT AGCCCCCGGC 
GAGAGAGTCT ACGCCTCGAG GCTCGTCGGG AGCACGATGT ACCTAGTTAC CTACAGGCAG 
GTCGACCCGC TCTTCGCAGT GGACCTCTCG GACCCGTCCA GCCCGCGCGT TCTCGGCTAC 
GTGAAGGCTC CCGGCTTCAG CGAGTACCTA CACCCCGTCA CCGGCAAGCT ACTCCTAGGG 
GTGGGCTTCA CAGACGATAG GAGGCTCAAG GTATCCCTCT TCGACGTCTC CGACCCGAAG 
GCTATAAGGG AGGCCTCCAC GGTCACTATC GCCGCCTCGT CCCCCGTAAC GTCCGACCAC 
CACGCGTTCA GCTTCGACCC GAGCAACGGG AGGGCGTACA TACCCGTCAG CCTCTGGTAC 
ACGGGGTCCG GCGGCGTAAT GGTGGTCGAA GTCAAGAATG GGAGGCTCTC CTTCGTGAAG 
CTACTGGAGC ACCCGGGCGC CCTGAGGACA GTGTACACTC CAGACGAGGT ATTCACGGTG 
TCGCAGGCAT CCGTCAATGT GTACTCCTCC AGCACCCTTG AGAAAGTAGG CGAAATACCC 
CTCGACTAG

Protein sequence

MDRRMLVAVV LLALIGALTP FALYVALGPR AAPTAETGAR GQRLLEFYPL GGETFASLKE 
ILDFAESRLK ALETARAYTA GAVLPTEATR AATAEVSKTN VQVVGVDEPD IVKAGSGVIA 
VARGSEVYIV GIAERKVLGK ISAGSQVFGL FLEGSRLAVI TSTPLIRPLV VLPGAGSPPY 
LGGVANTTLL VYSIEDPSSP RLLYSSSVSG YPLGARMLGG VVYILTSAPL EVKLPLVDGE 
PIPPGSVAKI DPSASWYLVL LCMDLSTGKH SAYAFTSAPS SWIYMGENRL YVASYPSVYE 
EALKEFLEAV SKRLPGGVSG RVSGLAFQGL LGEALNALED YLSSVSYDVA RDILEKAAAE 
VPPIPDKTIF KVFAVSGLKV SYRGSVEVPG RVLDQFSMEE LGGYFVVATT SGEWRVRASI 
AKTLITPPSP PSRNVTVEVC SGGSCREIVV PITVQPTSLR AGRPIVYVGV EPAADTSNNV 
FSVSLEDLKV KGNLTGLAPG ERVYASRLVG STMYLVTYRQ VDPLFAVDLS DPSSPRVLGY 
VKAPGFSEYL HPVTGKLLLG VGFTDDRRLK VSLFDVSDPK AIREASTVTI AASSPVTSDH 
HAFSFDPSNG RAYIPVSLWY TGSGGVMVVE VKNGRLSFVK LLEHPGALRT VYTPDEVFTV 
SQASVNVYSS STLEKVGEIP LD