Gene Tpen_1165 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_1165
Symbol
ID	4601179
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	+
Start bp	1106370
End bp	1107461
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	58%
IMG OID	639773941
Product	ABC transporter related
Protein accession	YP_920566
Protein GI	119720071
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.191612
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGCACGTG TAGCCGTCAA AGATCTTGTG AAAAGGTTTG GAAAAGTGGT TGCCGTCGAC 
AGGGTCTCCT TCGAGGCTAA GGACGGCGAG TTCCTCGTTC TCCTCGGCCC CAGCGGGTGC 
GGGAAGACCA CTACCCTGAG GATGATAGCC GGGCTAGAGA CGCCAGACGA GGGAGAGATC 
TACATCGGGG ACAGGCTCGT GAACGACCTG CCGCCCAAGG ATAGGGACGT GGCGATGGTG 
TTCCAAAACT ACGCTCTCTA CCCGCACATG AAGGTATACG ATAACATCGC TTTCCCGCTC 
AGGATAAGGA AGCTGCCGGC CGACGAGATA GACCGCAGAG TCAGAGAGGT GGCAAAGCTC 
CTGAGGATAG AGGAGTTGCT GGACAGGTAC CCGAGGCAGC TGAGCGGCGG GCAACAGCAG 
AGGGTCGCCC TGGGTAGGGC TCTCGTGAGG CAGCCACAGG TCTTCCTGAT GGACGAGCCT 
CTCAGCAACC TCGACGCAAA GCTGAGGGTG TACATGAGGG CTGAGCTGAA GAGGCTTCAG 
AGAGAGCTCG GCATAACAAC GATCTACGTT ACCCACGACC AAGCGGAGGC TATGACCATG 
GCGGACAGGG TAGCTGTGAT GAACGAGGGG AAGATAATGC AGCTCGCAGA CCCCGCCGAG 
CTCTACTTCA GGCCCGCGAA CACCTTCGTT GCGGGCTTCA TAGGAGCCCC GGCGATGAAC 
TTCGTAGACG CCTCGGCGAA GGTTGAAGAC GACACGGTCG TGCTCGACAC GGGGATCTAC 
CGCATCAGGC TCCCCAAGGA CGCCTCCGAG GTGCTGATAA AGCAGGGCGT GCCGAGCGAG 
GTCATATTCG GTATAAGGCC TGAGCACATC ACCGTTAGCA AGCAGGAGTT CCCCGGGAGC 
TTCGCCGCGG AGGTCTTCGT AACGGAGCCC CTAGGATCGG AGACGATAAT CGACTTCAAG 
CATGGAGACG CTATACTCAA GGCGAAGTAC CCCGGGCACT TCGAGGCCTC TCCGGGAGAG 
AAGATATACA TAGGCTTCCA GCTACAGTAC GCCCACGTGT TCGACAAGAA GACAGGAAAA 
GCCCTAGTCT AG

Protein sequence

MARVAVKDLV KRFGKVVAVD RVSFEAKDGE FLVLLGPSGC GKTTTLRMIA GLETPDEGEI 
YIGDRLVNDL PPKDRDVAMV FQNYALYPHM KVYDNIAFPL RIRKLPADEI DRRVREVAKL 
LRIEELLDRY PRQLSGGQQQ RVALGRALVR QPQVFLMDEP LSNLDAKLRV YMRAELKRLQ 
RELGITTIYV THDQAEAMTM ADRVAVMNEG KIMQLADPAE LYFRPANTFV AGFIGAPAMN 
FVDASAKVED DTVVLDTGIY RIRLPKDASE VLIKQGVPSE VIFGIRPEHI TVSKQEFPGS 
FAAEVFVTEP LGSETIIDFK HGDAILKAKY PGHFEASPGE KIYIGFQLQY AHVFDKKTGK 
ALV