Gene Tpen_0145 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_0145
Symbol
ID	4600637
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	-
Start bp	120098
End bp	121093
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	58%
IMG OID	639772899
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_919558
Protein GI	119719063
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4608] ABC-type oligopeptide transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTCCGAGG ATAAGGTTAT ACTGAAGGCG GAAAACCTGA AGAAGTGGTT CACTGTTCGG 
AGAGGTCTCT TCGGAGGCAC AGTGGAAGTA AAGGCGCTTG ACGGAGTTTC CTTCGAGTTG 
AGGGCAGGCG AAGCCGTATC GCTCGTCGGC GAGTCGGGTA GCGGGAAGAC GACGCTGGGC 
AAGACTATCC TCCGCCTCTA CGAGCCCACG GACGGTAAGC TCGTGTTCAA AGGTAGGGAC 
ATAACGCACA CGCCCGAGAA GGAGCTAATG TGGTACAAGA GGGAGACCGG GCTCGTGCAG 
CAGGATCCAT ACGGGGCCAT GCCGTCCTTC ATGAACATCT ACCGCATCCT CGAGGAACCC 
CTAATCATAC ACAAGGTCGG GAGCAAGGAG GAGAGGGCTG AAATGGTTTT CAAGGCCCTC 
GAAGAGGTAA GGCTCACCCC GGTAGAAGAT TTTGCGTACA AGTACCCGCA CATGCTTAGT 
GGCGGCCAGC TCCAGAGAGT AGCGATAGCG AGGGCGCTCA TACTCAAGCC GAGCCTTGTC 
GTAGCCGATG AGCCGGTATC GATGCTCGAC GCCTCCGTAA GGGTTGAGAT CCTCACGTTG 
ATGAGGGACC TGCAAGAGAA GAGGAATATT AGCTTCATCT ACATCACGCA CGACCTATCG 
ACGACGAGGT ACTTCAGCGA GTGGATCTTC ATAATGTACG CCGGCCACAT AGTGGAGAGA 
GCCCCAACGA AGACCCTACT CAGGAACCCG TTGCACCCGT ACACGCGCGC CTTGCTCTCG 
GCAATACCCG ACCCAGACCC CGAGAATAGG AAGAGGTACA GGGAGGTCCC GCCAGGAGAG 
CCGCCGAGCC TCGTGAACCC GCCGCCCGGG TGCAGGTTTG CGCCCAGGTG CCCCTTCGCG 
ACGAGCAGGT GCAGGAGCGA GGACCCGCCC GAAGTGGAGG TCGAGCCAGG CCACTACGTT 
AAGTGTTGGC TCTTCGCCGG AGAAGCGAAG GCTTAG

Protein sequence

MSEDKVILKA ENLKKWFTVR RGLFGGTVEV KALDGVSFEL RAGEAVSLVG ESGSGKTTLG 
KTILRLYEPT DGKLVFKGRD ITHTPEKELM WYKRETGLVQ QDPYGAMPSF MNIYRILEEP 
LIIHKVGSKE ERAEMVFKAL EEVRLTPVED FAYKYPHMLS GGQLQRVAIA RALILKPSLV 
VADEPVSMLD ASVRVEILTL MRDLQEKRNI SFIYITHDLS TTRYFSEWIF IMYAGHIVER 
APTKTLLRNP LHPYTRALLS AIPDPDPENR KRYREVPPGE PPSLVNPPPG CRFAPRCPFA 
TSRCRSEDPP EVEVEPGHYV KCWLFAGEAK A