Gene Tpen_1660 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_1660
Symbol
ID	4601242
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	+
Start bp	1606886
End bp	1608049
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	62%
IMG OID	639774433
Product	myo-inositol-1-phosphate synthase
Protein accession	YP_921058
Protein GI	119720563
COG category	[I] Lipid transport and metabolism
COG ID	[COG1260] Myo-inositol-1-phosphate synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGCGGTAG ACGTGGTTCG GGTAGCCCTG GTCGGGCAGG GTTACGTCGC AACGATCTTC 
GCGTGGGGGC TCTGCAAGCT GAAGAAAGGC GAGATCGAGC CCTGGGGAGT ACCGCTCGCA 
GACGTGGACT TCGGCGTCCC GGTGGAGGAC CTCGAAATTG CCGGGAGCGT AGACGTGGAC 
GAAAGAAAGG TCGGCAAGAG CCTCCGCGAA GTGGCACCTA TGTACGGGCT TAGCCCGGAG 
CCAGAGCTCG GAGAGGTCGT CGTGGCGCCC GGGCTTAAGC TGCGGAGCAC GCCCGGGTTC 
ATAAGGACGA AGGCTCTGGA CGACTCGAAG CCCCTGGCGG ACGCTTACGG GGCGTTCGAG 
GAATGGCTAG ACGACGTGAA ACCGGACGTC GTCGTAGACG TTACGAGTAC CGTTGCTTCC 
AGCCCCCTCT ACTCGTGGCG GGAGGTCGAG GAGAAAGCAT ATAGGGGCGA TCTACCCCAC 
TCGCAGGTCT ACGCTTTCCT GGTTCTAAGG CACGGGAGAT CCTCCTACGT GAACCTCCAG 
CCCGCTTACG TAGCTTGTAG CCCAGCGTTC GTAGAGAAGG CGCGGGAGAA CGGGTTGCTG 
GTTCTCGGCG ACGACGGCGC CACGGGGGCG ACCCCCCTCA CCGTTGACCT AGCCGAGCAC 
CTGAAGGAGA GGAACAGAAG GGTTCTATCG ATAGCACAGT TCAACATAGG GGGCAACACG 
GACTTCCTGG CGTTGACGGA GCCCGAGAGG AACCTGGCAA AGGAGAACAC TAAGTCGGGC 
TTCTTAAAGG ACATACTCGG CTACGAGCCT CCCCACTTCA TAAGGCCTAC CGGCTACCTC 
GAACCCCTCG GCGACAAGAA GTTCGTCTCG ATGCACGTTC AGTGGGTCTC CTTCGGGGGC 
TTCACGGACG AGCTCGTAGT GAACATGCGG ATAAACGATA GCCCGGCGCT AGCCGGGTAC 
ATCGTGGACC TCGCGAGGCT CGCCTACGCC CTCGCGAAGG CCGGTCTCCG CGGAACAGTA 
CCGGAGGTTA ACAGGTTCTA CATGAAGAGG CCGGGACCCC TGGACGCCAG GCACACCTCG 
AAGATCCAGG CTTACCGCGA GATGCTCGGG CTCCTCGAGG AGAAGCTCGG GGCGCGCCTC 
CGCGCGAAGC CTCTCAGCGC TTGA

Protein sequence

MAVDVVRVAL VGQGYVATIF AWGLCKLKKG EIEPWGVPLA DVDFGVPVED LEIAGSVDVD 
ERKVGKSLRE VAPMYGLSPE PELGEVVVAP GLKLRSTPGF IRTKALDDSK PLADAYGAFE 
EWLDDVKPDV VVDVTSTVAS SPLYSWREVE EKAYRGDLPH SQVYAFLVLR HGRSSYVNLQ 
PAYVACSPAF VEKARENGLL VLGDDGATGA TPLTVDLAEH LKERNRRVLS IAQFNIGGNT 
DFLALTEPER NLAKENTKSG FLKDILGYEP PHFIRPTGYL EPLGDKKFVS MHVQWVSFGG 
FTDELVVNMR INDSPALAGY IVDLARLAYA LAKAGLRGTV PEVNRFYMKR PGPLDARHTS 
KIQAYREMLG LLEEKLGARL RAKPLSA