Gene Tpen_1248 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_1248
Symbol
ID	4600543
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	+
Start bp	1183989
End bp	1184987
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	64%
IMG OID	639774024
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_920649
Protein GI	119720154
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCGT TGGAGGACAG GCAGGTGCTC TCGGCTAGGG GCGTAACCGT CAGGTTCTAC 
ACGTACGCCG GCGTCGTCCA CGCGGTCACG GACGCCTACC TCGACGTCTA CGAGGGCGAG 
AGCGTAGCCC TGGTGGGCGA GACGGGTAGC GGTAAGTCCG TGTTCACGAA GGCGCTTACA 
GGCCTCATAG ACCCCCCGGG GCGCATAGAG TCCGGGAGCG TTCTCTTCAG GAGGCGGGAC 
GGCAGGGTGG TCGACCTGCT GAAGCTTTCC CCGGAGGAGG TCCGGGAGAT AAGGGGCGAC 
GAGATATCCT ACGTGTTCCA GGACCCTTCG AGCGCGCTCG ACCCCCTCTA CACGGCGGGG 
GACCACATAG CCGAGACTAT AACGGAGCAC AGAGGCGTCC CCAAGGGGGA CGCGCTCAGG 
GAGGCCGTCT CCCTCCTAAG GGACGTCATG ATCCCGAACC CGGAGGTCAG GGTGAAGAAC 
TACCCGCACG AGCTGAGCGG CGGGATGAGG CAGAGGGTAG TCATAGCCAC CGCTATTGCG 
AACAAGCCGC GCCTACTCAT AGCGGACGAG CCCACGACAA ACCTCGACGT GACTGTCCAG 
GCCCAGATAC TCGACCTCCT GAAGGACCTC AGGTCCAAGT ACGGTATGAG CCTGCTACTC 
ATAACCCACA ACCTGGGCGT CGTCGCCGAG ACGGCGGACA GGGTCTACGT CATGTACGGC 
GGGAGGATAG CGGAGACGGC GGACGTGTAC ACGGTGTTCG AGTCGCCGGC ACACCCCTAC 
ACGCAGCTCC TCCTCCGCTC CGTCCCGAAC CCGCTGAAAA AGATCGAGCG CCTCGAGTCG 
ATCCCGGGGA CTGTCCCCAA CCTGATAGAC ATGAAGCCGG GGTGCCCGTT CGCTCCGAGG 
TGCCCCTTCG CCATGGAGGT TTGCAGCAGG GAGGACCCCC CGCGGGTAGA CCTGGGTGGG 
GGGCACGTCG TCCACTGCTG GTTGCACGCT AAGAGGTGA

Protein sequence

MSALEDRQVL SARGVTVRFY TYAGVVHAVT DAYLDVYEGE SVALVGETGS GKSVFTKALT 
GLIDPPGRIE SGSVLFRRRD GRVVDLLKLS PEEVREIRGD EISYVFQDPS SALDPLYTAG 
DHIAETITEH RGVPKGDALR EAVSLLRDVM IPNPEVRVKN YPHELSGGMR QRVVIATAIA 
NKPRLLIADE PTTNLDVTVQ AQILDLLKDL RSKYGMSLLL ITHNLGVVAE TADRVYVMYG 
GRIAETADVY TVFESPAHPY TQLLLRSVPN PLKKIERLES IPGTVPNLID MKPGCPFAPR 
CPFAMEVCSR EDPPRVDLGG GHVVHCWLHA KR