Gene Mthe_1678 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_1678
Symbol
ID	4463350
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	-
Start bp	1823786
End bp	1824907
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	55%
IMG OID	639700696
Product	glycosyl transferase, group 1
Protein accession	YP_844084
Protein GI	116754966
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGATAC TGGTCATACC GACAACTGAC TGGATAAGAC ATCCGTTTCC GAACAGGTTG 
AACTTCATAT TCGATATAAT AGCGGAGAGG CATGAGGTGC AGGTTTTGCA CTTCGAGCTC 
TCGAAGTTCA GAGATAACAG CCCGAGATGG ACGAGATGCT CTCTTTTGAA GGCAGGATCG 
TCCAAAGCTG AGGATCCGTC TGTCTACTAC ATCACAAGCG CTTTATCCCA TCTCCGCGTG 
ATCCGCGATG CTGCCAGGGA CTCTGATGTG ATTCTATCAG CGAACATCCT CCCGTCCTTC 
ATGGCGAACC TCACAGATAC GCCCGTGGTC TTCGACTATC TCGACCATCT GGAGGAATCC 
GCATCCATAT ACTACCCGGG CTCGCTCTTC GGCAGGGCTG TCAAGCTCGG CGTCAGGGCG 
ATCACCAGGT ACAACCTCAG GCACGCCAGG GCTGTGATAA CCGTGACCCA GGAGCTCAAA 
GAGTACCTCA GAAACATCGG CGTTCGTGAT GTGGAGATCA TTCCGAACGG CGTGGACACG 
AGCCTTCTGA AACCTATTGA TGCTGGAGAG GCAAAGATCG CTCTCGGTCT TGAGGGGGAT 
GTGATCGGTT ACGTCGGATC GCTGGAGTAC TGGGTCGATC TCGAGACCGT TGTGAGCGCT 
CTGCCAGATC TCGATGTCAC ACTCCTCGTT GTGGGCCCGA GCCTGTTCAC GGATTACGGC 
GAGCGCATAA AGGATATGGC TGAGCGGCTC GGCGTTGGAG AGAGGGTGAT CTTCACGGGA 
GCTGTGCCGT ACGCGGAGCT CGGCAGGTAC ATATCTGCGA TGGACATAGG CCTCAACCCC 
CTGAGAATGA TGAAGAAGAA CGAGTATGCT GCTGGAGGGA AGATCTTCAA CTACCTCGCA 
TGCGGCAGGC CTGTTCTCAC CACAAGAATG CTCTCGCTCG AGCGGCTTCT CGGGGACAGC 
CTGTACTACT ATGATGACAG GGAGAGCTTC ATATCGCAGG TGAAGCGTAT CCTGGAGAGC 
CCGCAGGATC AGAGAAGATA CAGGGAGATC GCTGAGAGGT ATGACTGGCG CGCTCTGGCA 
GCCAGGTACG AGAGCGTTCT GAGGAGGGCT GCAGAAGATT GA

Protein sequence

MKILVIPTTD WIRHPFPNRL NFIFDIIAER HEVQVLHFEL SKFRDNSPRW TRCSLLKAGS 
SKAEDPSVYY ITSALSHLRV IRDAARDSDV ILSANILPSF MANLTDTPVV FDYLDHLEES 
ASIYYPGSLF GRAVKLGVRA ITRYNLRHAR AVITVTQELK EYLRNIGVRD VEIIPNGVDT 
SLLKPIDAGE AKIALGLEGD VIGYVGSLEY WVDLETVVSA LPDLDVTLLV VGPSLFTDYG 
ERIKDMAERL GVGERVIFTG AVPYAELGRY ISAMDIGLNP LRMMKKNEYA AGGKIFNYLA 
CGRPVLTTRM LSLERLLGDS LYYYDDRESF ISQVKRILES PQDQRRYREI AERYDWRALA 
ARYESVLRRA AED