Gene Mthe_0901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_0901
Symbol
ID	4462365
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	+
Start bp	978636
End bp	979847
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	56%
IMG OID	639699920
Product	nucleotidyl transferase
Protein accession	YP_843329
Protein GI	116754211
COG category	[J] Translation, ribosomal structure and biogenesis [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1208] Nucleoside-diphosphate-sugar pyrophosphorylase involved in lipopolysaccharide biosynthesis/translation initiation factor 2B, gamma/epsilon subunits (eIF-2Bgamma/eIF-2Bepsilon)
TIGRFAM ID	[TIGR01208] glucose-1-phosphate thymidylylransferase, long form

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAGCA TGCAGGCGAT AATACTTGCT GCTGGCGAGG GCTCCAGGAT GCGGCCCCTC 
ACCGCGAGCA GGCCGAAGGT CATGCTCCCT GTAGGCGGAG CCCCGCTGCT CGAGGAGCTC 
GTACTGAGAT GCAGAGAGGC GGGGATAAAC AGGTTTGTGT TTGTTGTTGG CTATCGCAGA 
GATGTGGTAA CATCCTATTT CAAGGATGGC AGCGATTTCG ATGTGGATAT CAGCTACGCG 
GTGCAGGAGA AACAGCTGGG CACAGGACAT GCACTAATGA CCGCGAGAGA CCTCTCAGAT 
GATCGATTCT TTGTCATAAA CGGAGATGTG CTTCCAGACG TCCAGGCGCT CAGACGTATG 
ATCTCAATGG AGGATCTAAG TGTTGCAACG CACAGGGTAG TGGAGGCGAG CCGTTACGGC 
GTGTTTCTGC TCAGAGATGG GCTTGTGGAG GGGGTCGTGG AGAAGAGCCC GTCGCCGCCG 
TCTGACATGG CAAACGCTGG AATATATCTG CTTGACAGGG AGATCTTCGA GCTCATGGAG 
GAGGTGCCTG TCTCAATCAG GGGAGAATAC GAGCTCACCG ATGGAATTAA TGCACTTGCG 
TCCGCTGGCA GAAAAATCTG GGCCATTGAG CTCAGCGAGT GGGTTGAGGT TGGCGTTCCC 
TGGGATATAC TCACGGCCTC GAATGCTGTG CTCTCGAGAA AGGTCCCTGT CATGGATGGG 
GATGTGGAGA GCGGCGCCAC GCTCAAGGGA AACGTATCAA TCGGCAGCGG CACACTGGTG 
AGAAATGGCG CCTACATCGA GGGCCCGGTG TGGATCGGGA GGAACTGCGA CATAGGGCCG 
AACTGCTACA TTCGCGCAGG ATCATGCATA GGGAACAGCG TGAGGGTCGG AAATGCGGTC 
GAGATAAAGA ACTCGACCAT CATGGACGAC ACCAAGATCG GCCATCTATC CTACGTGGGG 
GATAGCGTCA TCGGGTATGG CTGCAATCTC GGGGCCGGCA CCATCGTATC GAATCTCAGG 
CATGACAACA GAAACATCCG CTCTTACGTC AAGGGCGTGC TTGTGGACAC AGGCAGGAGA 
AAGCTTGGTG TTATAATGGG TGATGGCGTT AAGACGGGAG TGCATACCTG CATCTATCCG 
GGAACCGTGA TAGAGCCCGG CTATCTCTCG AGGCCGGGCG AGGCCCTCAG GGGATACGTG 
AAATCCATAT AA

Protein sequence

MNSMQAIILA AGEGSRMRPL TASRPKVMLP VGGAPLLEEL VLRCREAGIN RFVFVVGYRR 
DVVTSYFKDG SDFDVDISYA VQEKQLGTGH ALMTARDLSD DRFFVINGDV LPDVQALRRM 
ISMEDLSVAT HRVVEASRYG VFLLRDGLVE GVVEKSPSPP SDMANAGIYL LDREIFELME 
EVPVSIRGEY ELTDGINALA SAGRKIWAIE LSEWVEVGVP WDILTASNAV LSRKVPVMDG 
DVESGATLKG NVSIGSGTLV RNGAYIEGPV WIGRNCDIGP NCYIRAGSCI GNSVRVGNAV 
EIKNSTIMDD TKIGHLSYVG DSVIGYGCNL GAGTIVSNLR HDNRNIRSYV KGVLVDTGRR 
KLGVIMGDGV KTGVHTCIYP GTVIEPGYLS RPGEALRGYV KSI