Gene Tpen_0146 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_0146
Symbol
ID	4600638
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	-
Start bp	121100
End bp	122068
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	56%
IMG OID	639772900
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_919559
Protein GI	119719064
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAGCG TGCTCACGGT TAGAAACCTG CGCCTCTACT TCTCGACGCG TAAGGGGGTA 
GTCAAGGCTG TTGACAACGT GAGCTTCGAC CTTAAGAAGG GAGAGACCCT TGCCATAGTC 
GGCGAGTCCG GTTGCGGTAA GAGCTCCCTG GCGAGGGCCC TGATAAGGCT CCTGCCGAGG 
AACGTCCACA CGTTCACCGG AGAGATATAC ATCAACGGTA ACGACGTGAT GAAGCTCAGC 
GACGAGATGT TCAGAAGGCT TATACGCTGG CGTAAGATCT CCATGGTCTT CCAGGGAGCC 
CAGAACAGCC TGAACCCCGT CCTCAAGGTA GGCTTCCAGG TAGCGGAGCC CCTAATGATT 
CACAACAACA TGTCCCCCGA GGAGGCCCTC GCAGAGGCGA AGAAGTACCT GAGGCTCGTG 
GGGATACACG AGAGCTTTGC CGACAGGTAC CCCTTCGAGC TTTCGGGAGG TATGAAGCAG 
AGGGCTGTCA TAGCTATGGC GCTAATCACT CACCCCGACA TAATAATTCT GGACGAGCCG 
ACGTCCGCGC TAGACGTAAT CACGCAGGCC AACATAATCA ACCTGCTCAA GCGAATTAAG 
AACGAGATGG GTCTCTCATA CATCTTCATC ACCCACGACA TAGCGGTTAC CAGCGAGCTA 
GCGGACCGCG TAGCAGTTAT GTACGCGGGA GAGATAGTCG AGATAGCGGA TGCAGACGAG 
TTCTACACAA ACCCCAGGCA CCCGTACTCC GAGAAGCTTA TGGCGAGCGT ACCAACTCTG 
AGGACGGACA AGAAGCTGGA GTTCATACCC GGCGCTCCTC CAAGCCTGAT AAACCCGCCG 
CCCGGGTGCA GGTTCCACCC GAGGTGCCCC TACGCCTACG AGAGGTGCCT CAGGGAGAAC 
CCCCCGCCCT TCGAGCTTAA GACCGGTTCC TTCGTTAAGT GTTGGTTGTA TCACGAGGGG 
AAGAGGTGA

Protein sequence

MSSVLTVRNL RLYFSTRKGV VKAVDNVSFD LKKGETLAIV GESGCGKSSL ARALIRLLPR 
NVHTFTGEIY INGNDVMKLS DEMFRRLIRW RKISMVFQGA QNSLNPVLKV GFQVAEPLMI 
HNNMSPEEAL AEAKKYLRLV GIHESFADRY PFELSGGMKQ RAVIAMALIT HPDIIILDEP 
TSALDVITQA NIINLLKRIK NEMGLSYIFI THDIAVTSEL ADRVAVMYAG EIVEIADADE 
FYTNPRHPYS EKLMASVPTL RTDKKLEFIP GAPPSLINPP PGCRFHPRCP YAYERCLREN 
PPPFELKTGS FVKCWLYHEG KR