Gene Tpen_1032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_1032
Symbol
ID	4600511
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	+
Start bp	973412
End bp	974626
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	64%
IMG OID	639773810
Product	hypothetical protein
Protein accession	YP_920435
Protein GI	119719940
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.435102
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGGCGAAG CTTCGAAAGT CCTCGTCGCC GCTACCACGC GGGACGGCCG CCTGGTCTAC 
TTGTCTGCAG TTGCTAAGCC TCAACAGCCG GGGCTAGACG AGGCTCTCGC GAGCCTCCTG 
AAAAGCTTGG CGTACCACAG CTACGAGGAG CTCCAGGGAG ACAGGGTCCT GCTGGAGGCG 
AAGAAGGCTT TATCGTCGCA GGGCTTCAAG GTGGAGGACC TCGAGCTCTC TGTTTCCTTC 
AGATGCCCCT CCTGCGGAGC CTCCATAAAC TTCTCGCCTG AAACCGTCGT CTACGTGTGC 
CCCTACTGCG GGTGGAGCGG CGACGTGTAC GGGAGGGAGC TACGCGTGAA GGCTTGGCCC 
CCGGGAGGCA GGGAGAAGCT GGAGGAGATA GTCAGGGGTC TGGGGGGAGT CCTACACGAC 
GCGGTTCTGC GCTACGTGCC CTTCTGGGTC TTCAAGGTGA AGGTAGAGGG CTCGTACGCG 
GGGACAGCGA CGTACACTGT TACCAGGACG GAGTACGTCA CGGTGATCCA TGAGGGCAGG 
CCCCGGCAGA TCCCGACGAC CAGGACGGAG GTTAGGAGGA AGAAGGTTGC GGGCCGCGTG 
AGCTTCTCTA CGGTCAAGGG CGTGGGGGCG CGGGTACTCG CCGAGGTGTT CGGAGGGGAA 
GGCCTGAAGA GGTGGGTGGA GTACGAGTGG GAGAACAACC CTCCCCCGGA GCTGAGCGCC 
GAGCAGGTTA AGCCCGTGGC GCAGAGCTTC CTCTCGGCCG AGGTGGACGC GGGGGAGGCG 
CTCGGCATTG CTAGGAGGGA GATAGACTCC GAAATATACG CAGAGATAGA GAGATCGGCG 
CGGAGGCAGG TGGAAGGCTC CCTGAAGGAA GTTGCGGTCG AGTCCCTCTC GGTGGACCTC 
AAGGTAGTCG AGAAGAGCCT CGTCTTCGTC CCGTACTGGT TCTTCACGTA CAAAGTGGAG 
GGAAACCTCT ACGCGGGGGC CGTGGCGGGA CCGAAAGCCA CCCTCCTGAA GGCCGAGCGT 
CGCATCTCGA ACATCGAGAG GGCCGCGAGG CTCGCCGGAG CGTGGATAGC CGTGCTGGCC 
TCGGGCGCGC TGGCGCAGGT CTCGGTGGGT AGCGACCTCG GCTTCCCGGG CGTCCTAATG 
GCGTGGGCTA TAGGGTTGGT AGGAGCCTAC AAGCTCGCCG AGTCGGCGTT CGCCCCGGCG 
GAGGTGGTAG CGTGA

Protein sequence

MGEASKVLVA ATTRDGRLVY LSAVAKPQQP GLDEALASLL KSLAYHSYEE LQGDRVLLEA 
KKALSSQGFK VEDLELSVSF RCPSCGASIN FSPETVVYVC PYCGWSGDVY GRELRVKAWP 
PGGREKLEEI VRGLGGVLHD AVLRYVPFWV FKVKVEGSYA GTATYTVTRT EYVTVIHEGR 
PRQIPTTRTE VRRKKVAGRV SFSTVKGVGA RVLAEVFGGE GLKRWVEYEW ENNPPPELSA 
EQVKPVAQSF LSAEVDAGEA LGIARREIDS EIYAEIERSA RRQVEGSLKE VAVESLSVDL 
KVVEKSLVFV PYWFFTYKVE GNLYAGAVAG PKATLLKAER RISNIERAAR LAGAWIAVLA 
SGALAQVSVG SDLGFPGVLM AWAIGLVGAY KLAESAFAPA EVVA