Gene Tpen_1053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_1053
Symbol
ID	4600796
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	+
Start bp	991094
End bp	992287
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	67%
IMG OID	639773831
Product	MoeA domain-containing protein
Protein accession	YP_920456
Protein GI	119719961
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0303] Molybdopterin biosynthesis enzyme
TIGRFAM ID	[TIGR00177] molybdenum cofactor synthesis domain

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.304827
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCACAGCG TCGGCAGGGT TCTCGGGGAG GTTTCCGGCC TCCTCTCCCG GCCGCCCGCA 
GAGAGCGTGC CGGTCCTCGA CTCTCTCGGT AGGTACTCCG CCGAGACCGT AGTGTCGTCC 
TTCAAGCTCC CCCCTGCCCC GAAGAGCGTG GTAGACGGCT ACGCCGTCAG AGCTGAAGAC 
GTGGAGCCCG CGTCTCCGGG CGCCCCGGTT ACCCTGAGGT TGCTGGAAGG AGTCCTGAGG 
CCCGGCTCAA CCGAGGGGTT CGAGTTGCCG AGGGGCTCCG CGGTAAGGGT TGAGACGGGC 
GCTCTTCTAC CGGTGGGCGC GGACGCCGTC GTGCCCGTCG AGGACGCCTT GGAGGAGGAC 
GGCAGGGTCC ACCTGTTCAG GAGGGTCGCG AGGTACGAGA ACGTCTCCCT GCCGGGCGAG 
GAGTACGAGG AGGGAGTCCC CATAGTTAGG GTGGGCGACC GCATCCAGCC GCACCACCTC 
TCGGCCCTCG TGCTCGAGGG GAGGAGCCAC GTGAACGTGT TCAGAGTCGA GGCGAGCATC 
CTCAACGTGG GCGACGAGAT AGTGGGGGGC ACGTACTTCA GGCCGTTCAC GCACTTCCTC 
GTAGCCTCCT GGCTGAGGAG CCTGGGCTTC AGGGTGACCG ACGTCTCCGT GGCCCCCGAC 
TCCCCCGAGG CAGTGGCGGA GTGGGCGGGG AGCAGGGGTG AGTGGCTCGT CGTGATCCTA 
GGCGGGACCT CGATGGGTGG GCACGACTTC ACCGTTAAGG CGCTCGAATC CCTAGGGCCC 
GAGTACATCG TGCACGGGCT CGCGCTTCAA CCGGGCAAAA CGGCTTGCGT AGCCGTGAAG 
GGCGGCCGCC TCTACCTCGC AGCTAGCGGG CTCCCCGTGG CAGCCCTCTC CACGCTCGAG 
GTCTTCCTGA GGCCCCTCCT CAGACGCGTA GGCCTGAAGG TCCCGCTACT CCCGAGGGTG 
AAGGCGAGGC TAACGAGGAG GATCACCGTC AAGGCCGGCG TGGTCGGGTT CGCCAGGGTC 
AGGGTGTACA GGGAGGGAGG CACCCTTCTA GCTGAGCCTG TCATGCTGGG CGGCTCCGGG 
GCGCTTGCGA GCCTTTTGAG GGGCAACGGC TACGTGATCG TGCCGGAGGG CCTAGAGGGC 
TACGACGAGG GAGAAGAGGT CGAGGTACAC CTCTACGGGG AGGTCGAGGA GTGA

Protein sequence

MHSVGRVLGE VSGLLSRPPA ESVPVLDSLG RYSAETVVSS FKLPPAPKSV VDGYAVRAED 
VEPASPGAPV TLRLLEGVLR PGSTEGFELP RGSAVRVETG ALLPVGADAV VPVEDALEED 
GRVHLFRRVA RYENVSLPGE EYEEGVPIVR VGDRIQPHHL SALVLEGRSH VNVFRVEASI 
LNVGDEIVGG TYFRPFTHFL VASWLRSLGF RVTDVSVAPD SPEAVAEWAG SRGEWLVVIL 
GGTSMGGHDF TVKALESLGP EYIVHGLALQ PGKTACVAVK GGRLYLAASG LPVAALSTLE 
VFLRPLLRRV GLKVPLLPRV KARLTRRITV KAGVVGFARV RVYREGGTLL AEPVMLGGSG 
ALASLLRGNG YVIVPEGLEG YDEGEEVEVH LYGEVEE