Gene Tpen_0165 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_0165
Symbol
ID	4601420
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	+
Start bp	139899
End bp	141131
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	56%
IMG OID	639772919
Product	hypothetical protein
Protein accession	YP_919578
Protein GI	119719083
COG category	[R] General function prediction only
COG ID	[COG1721] Uncharacterized conserved protein (some members contain a von Willebrand factor type A (vWA) domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGACAGTTA AGGCTGTTGC CACCATTGCG GGTAGCGCGG CGACCCTCCT GGTAGCAGTC 
CTAGCACAGA GGTGGTTCGT GGCCCTCTTT TCCGTGCCAC TCCTGCTACC TCTGTTTGCC 
TCGCTTCTCT ACGTTCACCC CTCGGAAAAG CACATTGTAG CAGAGAGAGT TGTGCCCAGG 
TCGAACTTTG TAGCGGGAGA CACTGTGCGC GTAGAGATTT CGGTCCGGAA CGTCTCGAAC 
CGGAGCGTGG TGCTCGAAGT ACGGGAAAAG CTGGGCGAAG GGCTCCGCCT AGTGGGCGGT 
GACACGGTAA TGCTGAGCGT CTTGAAGCCT CACCAGGAAA AGAGGTTTAC GTACTACGTG 
ACGGCGGATA GAAGGGGCCA CTACGACCTA GGACCCCTGG AAGTCTACTC CCTCGACCCC 
TTCCTGTTTA CGCGTGTAAA AGTGAAGGAG TATGGGGCGG AAAGGCTGAC GTTTTTCCCG 
AAGATACGTA GGATCGACTA CATACCTATG CCCGCCGCTC GTACAACGCT TCTCCCGGGA 
GAGGCTATGT CGAATGCTCC GGGTGAAGGT TTCGAGTTTA TGGAAGTGGG CGAGGCGCGG 
GGTAGCGGGC TCAGGAGGAT CAACTGGAAG GCTACCGCCA AGACAGGTAG GCCTATGGTT 
AACGTTTACC TGGGGGAGAG GTCCGCTGAG TGCCTCATCG TGCTCGACGT TCCCTCGAGT 
AGGTTGCTGG GCCGGGCACT CACAGAGGTG CTCGTTGACA AGATGGTCGA GTACACGGGA 
AGCCTTGCCT ACTACTTGAC CCGCAGGGGT AACAGGGTGT CGCTACTGGT GGTAGGACAC 
TATAGGGACT GGGTAAAGCC GGGGTTCGGT AAAAGGCACT TTTTGAGGAT TCTCCACTCC 
CTAGCCGACG TCAAAAGTCT GGAGACAAAA ACCCTGGTGG ATTACTCCGA GGTGTTTAGC 
CGCGTTGCTC CGTTCCTGGC GAAGAGCAGG TCGCTCGTCT TCATAGTGTC AACGTTTACC 
GAGAAAGCCG CATTCGAGAT CCTCGGGGAA GCCGAGAGGA GCGGCTACGT CGTGCGACTA 
GTAGCGATCA ACCCTTTCAA CTCCGTAGCC GAGCACTGCG AAAAGGATAA GCTCGAGCCG 
TTGAAATTGC TGAGCGATGC CTGGGAGTAC GGTCTTCCGA GGGTTTTGAG CAGAGGATCT 
CCGAGAACTA AGCTTTTAAG CGGTGGGGGA TGA

Protein sequence

MTVKAVATIA GSAATLLVAV LAQRWFVALF SVPLLLPLFA SLLYVHPSEK HIVAERVVPR 
SNFVAGDTVR VEISVRNVSN RSVVLEVREK LGEGLRLVGG DTVMLSVLKP HQEKRFTYYV 
TADRRGHYDL GPLEVYSLDP FLFTRVKVKE YGAERLTFFP KIRRIDYIPM PAARTTLLPG 
EAMSNAPGEG FEFMEVGEAR GSGLRRINWK ATAKTGRPMV NVYLGERSAE CLIVLDVPSS 
RLLGRALTEV LVDKMVEYTG SLAYYLTRRG NRVSLLVVGH YRDWVKPGFG KRHFLRILHS 
LADVKSLETK TLVDYSEVFS RVAPFLAKSR SLVFIVSTFT EKAAFEILGE AERSGYVVRL 
VAINPFNSVA EHCEKDKLEP LKLLSDAWEY GLPRVLSRGS PRTKLLSGGG