Gene Tpen_1054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_1054
Symbol
ID	4601440
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	+
Start bp	992287
End bp	994242
Gene Length	1956 bp
Protein Length	651 aa
Translation table	11
GC content	64%
IMG OID	639773832
Product	molybdenum cofactor synthesis domain-containing protein
Protein accession	YP_920457
Protein GI	119719962
COG category	[H] Coenzyme transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0303] Molybdopterin biosynthesis enzyme [COG1910] Periplasmic molybdate-binding protein/domain
TIGRFAM ID	[TIGR00177] molybdenum cofactor synthesis domain

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.39347
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGCGCA AGATCTACAG GAGCCTGGTT GGGGTGGACG AGGTTCTACC CATCATAGAG 
TCGTACAGGC CGCTGGTACC CCTCGGAGTC GTCGAGCTAC CGGTGTCCGA GGCTGTCGGG 
AGGGTTCTCG CGGAGAACGT TTTCTCCCCG CTCAACTACC CGCCCTACAC GCGGGCCCTC 
GTAGACGGCT ACGCCGTTCG CAGCGACGAC CTCGTCGGCG TATACGAGGA TAGGCCAAGG 
AAGCTGAGGC TTGTAGGCAA GGTTTCGACT GGGGAGACTA GGCTCGTCAC GATAGGCAGG 
GGCGAGTGCG TCGAGGTATC CACGGGGGCG GTAGTCCCCT ACCCCGCGGA CGCCGTTGTT 
CCGGTCGAGT ACACCCACCA GGAGGGGGGA GAGGTCACTT TCTACAGGTC GGTCGCGCGC 
GGCGAAAACG TGGACGCCGC CGGCTCGGAC GTAGCCGAGG GCGAAGTCGT AGCCTGGAAG 
GGCACCCAGC TTACCCCCAC GCTCGCCGCG ACGCTCGCCG CGCTCGGAGT TCGAACAGTG 
AAGGTCTACA GGCCCGTAAG GCTCGGCATA GTCCCCACGG GGAACGAGCT CAGGCAGCCG 
GGAGAACCGC TGGAGTACGG CCAGGTGTAC GACTCGAACT CCACGATGGT GTACGCCTAC 
GCGAAGCTAG CGGGCGCCGA GCCCAAAGTG TACCCCCGTG CGCGCGACGA ACTCGGAGAA 
GTCGAGGAGG TCCTGCACAG AGCCCTCGAC GAGAACGACG TCGTAGCCAC GATCGGCGGG 
ACCTCAGCGG GGCCCGAGGA CCTAGTATAC AGGGCCCTTT CGAGGCTGGA CCCGGGGATA 
ATCCTCCACG GAGTCCGCGA GAAGCCCGGG AGGCCCCTCG CCGTCGCCCT GCACGGCGAG 
AAGATAGTCT TCAGCCTGCC CGGCTTCCCG ATGTCCTGCC TCCTAACGGT CAACCTGTAC 
CTGCTACCCG TAATCCTCAG GCTTCAGGGA GTGTCTCCCC AGCAGCTCCC CCGGAGGAGG 
GCGGTCATCG CTACGCCGCT CCGCGGCGAG GCCGGGATAA GGGTCTTTGT CCCGGTGATA 
CTGGCGGAGA GGGGTGGGCG CCAGGCGGCT TTCCCGTTGC CGGGGCACAG CGGGAGAGTA 
TCCTTGATGG TCCTCGTCGA CGGCTTCGCG GTGATCCCGG AGAACCTCGA GTACGCCCCC 
GAGGGGAGCG AGCTGGAAGT AGTGCTGAAC CCGTTCCAGA GGGCTTACCG GGTGAACATC 
ATCGGGAGCC ACGACCCGTT GCTCCAGTCG ATAGTAGCCA GTATCCCGGA GGCCGGGGAA 
GTGCGCGTGG TGAACGTGGG TAGCCTCGCC GGGCTACAGG CGGTGAAGTC TGGCGTAGCG 
GATATCGCCG GCACACACCT CCTCGACCCC GAGACGGGGG AGTACAACGT CCCCTACGTT 
AAGCGCCTCG GGATAAGGGA CGCCGTCCTC GTGAAGGGCT ACAAGCGCGA GCAAGGATTC 
GTCTACAGGA AAGAGGTAGG CCCGGTATCG AGCTTCGCGG AGGTAATAGA GGGGGGCTAC 
AGGTTCGTGA ACAGGAACCC CGGGAGCGGT ACCCGGGTAC TCGTAGACCA CCTCCTAGAG 
GAGGAAGCCA GGGGGAAAGG CGTCGACGCG GCGGAGCTCA AGGAGAGGCT TAAAGGCTAC 
TCGTTCGAGG TTAAAACCCA CGAAGCCGTA GCCTACCTCG TAAGCCGGGG AGTAGCCGAC 
GTCGGCGTAG CCGTGAGGTA CGTTGCGGAG CGCTACGGGC TGGGCTTCAC GTACCTGGCG 
AGCGAGGAGT ACGACCTCCT AGTCAGGAAG GAGTCCCTCG AAAAAAGCGC GGTGAAGCGG 
ATTATCGAGG CTTTAAGGGA GCTTTCCCGC AGGGGAGACG CCGGCTTAAA GGGCTACATC 
GTGGGCCCGG AGACGGGCAG TATAATCGAG CTCTGA

Protein sequence

MQRKIYRSLV GVDEVLPIIE SYRPLVPLGV VELPVSEAVG RVLAENVFSP LNYPPYTRAL 
VDGYAVRSDD LVGVYEDRPR KLRLVGKVST GETRLVTIGR GECVEVSTGA VVPYPADAVV 
PVEYTHQEGG EVTFYRSVAR GENVDAAGSD VAEGEVVAWK GTQLTPTLAA TLAALGVRTV 
KVYRPVRLGI VPTGNELRQP GEPLEYGQVY DSNSTMVYAY AKLAGAEPKV YPRARDELGE 
VEEVLHRALD ENDVVATIGG TSAGPEDLVY RALSRLDPGI ILHGVREKPG RPLAVALHGE 
KIVFSLPGFP MSCLLTVNLY LLPVILRLQG VSPQQLPRRR AVIATPLRGE AGIRVFVPVI 
LAERGGRQAA FPLPGHSGRV SLMVLVDGFA VIPENLEYAP EGSELEVVLN PFQRAYRVNI 
IGSHDPLLQS IVASIPEAGE VRVVNVGSLA GLQAVKSGVA DIAGTHLLDP ETGEYNVPYV 
KRLGIRDAVL VKGYKREQGF VYRKEVGPVS SFAEVIEGGY RFVNRNPGSG TRVLVDHLLE 
EEARGKGVDA AELKERLKGY SFEVKTHEAV AYLVSRGVAD VGVAVRYVAE RYGLGFTYLA 
SEEYDLLVRK ESLEKSAVKR IIEALRELSR RGDAGLKGYI VGPETGSIIE L