Gene Tpen_1559 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_1559
Symbol
ID	4600908
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	-
Start bp	1508827
End bp	1510182
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	61%
IMG OID	639774332
Product	L-fucose isomerase and related proteins-like
Protein accession	YP_920957
Protein GI	119720462
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2407] L-fucose isomerase and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.252286
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGTTGAGC TGACCGTGAA GCCTGTTCTT GCGTACAGCG TGTACGAGAG GCGCGAGGCT 
ACGAGCTGGC GCGCCTGGGG AGGGATAGCG GACGAGGAGA GCGCTGAGGA GGAGAGGCGT 
AGGATCAAGG CCGAGCTAAA GAACCTCGAG CAGAGAGCCG GCTTCCCCCT CAAGTTTCTA 
CCAGTAGGCA TGGTGAAGAG CTACGGGGAC GTGGATCGCC TGGAGAAGGC GGACGTTTAC 
CTGCTCTACG CCGCCGGCGG GGACGAGGGG CTCCTGATAG GCGTTGCCTA CCGCGGGCCG 
ACAGTTGTTT TCCTCAGGCA TAGGTCCGGC CCCCTCTACC TGTGGTACGA GATAATAGAC 
GCCAGGCTGA TAAGGCGGTA CAACGACCGC ATCGGTCAGG TTTGGCTGGA CTACGACGAC 
GTGGTCGTAG ACGACTACGA GGAGCTTCTG AGGAGGCTCC GGGCGCTCTA CGCCTTGAAG 
AACACCCTCG GGGCTAGGGT TGTCGCGGTT GGAGGCGCGT CGGGGTGGGG TATAGGCGGG 
AAGGCTGTCG AGCTTGCGAG GGCGAGGTGG CACCTCGACA TAGTCGAAGT CTCCTACGCC 
GAGCTTGCCG AGAGGATAAA GAAGGCTATG GGCGACGAGC GGTGCTTGGA GGAGGCTAAG 
CGGATGGCTA AGGAGTACCT CTCGGAGGAG GGGGTACGCC TGGAGACTAG GGAGGAGTTC 
GTCGTGAACG CCTTCGTCCT GTACCTCGTG TTTAAGCAAC TCCTCGAGGA GCACGAGGCC 
AGGATAATAA CTGTGAACGA GTGCATGACA ACGATAATGC CTATCGCGAA GACCACCGCG 
TGCCTCGCGC TCAGCCTCCT GAACGACGAG GGTTACCTCG CGCTCTGCGA GAGCGACTTC 
GTCGCTATAC CCGCGGCGAT ACTTCTCCAC TACGCCTCCG GGAAGCCCGT GTTCCTCGCA 
GACCCCACGT TGCCCCACGA CGGCATAGTG ACTGTAGCCC ACTGCACAGC GCCTAGGCTC 
ATGGACGGCA GAAGTAGGGA GCCGGCCCGG ATACTCACGC ACTTCGAGTC CGACTACGGA 
GCGGCACCCA AGGTGGAGTT CAGGAAGGGG CAGGTAGTGA CGGTGCTCAT CCCAGACTTC 
GAGGAGAAAA CTTGGGTGGG CTTCAGGGGG AAGATTGCAG AAGCCCCCTT CCTGCCCATC 
TGCAGGAGCC AAGCCGAGAT CGAGATAGAG GGGGACTGGC GACGCCTCCT AAGGGAGCTC 
AGGGGCTTCC ACTGGCTGAT AGTATACGGG GACTACCTGC GCGAGGTTAG CTACGCGCTC 
AAAAAGGTGG GGATGGAATT CGTGGAGATA GGCTAG

Protein sequence

MVELTVKPVL AYSVYERREA TSWRAWGGIA DEESAEEERR RIKAELKNLE QRAGFPLKFL 
PVGMVKSYGD VDRLEKADVY LLYAAGGDEG LLIGVAYRGP TVVFLRHRSG PLYLWYEIID 
ARLIRRYNDR IGQVWLDYDD VVVDDYEELL RRLRALYALK NTLGARVVAV GGASGWGIGG 
KAVELARARW HLDIVEVSYA ELAERIKKAM GDERCLEEAK RMAKEYLSEE GVRLETREEF 
VVNAFVLYLV FKQLLEEHEA RIITVNECMT TIMPIAKTTA CLALSLLNDE GYLALCESDF 
VAIPAAILLH YASGKPVFLA DPTLPHDGIV TVAHCTAPRL MDGRSREPAR ILTHFESDYG 
AAPKVEFRKG QVVTVLIPDF EEKTWVGFRG KIAEAPFLPI CRSQAEIEIE GDWRRLLREL 
RGFHWLIVYG DYLREVSYAL KKVGMEFVEI G