Gene Mthe_1539 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_1539
Symbol
ID	4462521
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	+
Start bp	1670502
End bp	1671527
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	59%
IMG OID	639700562
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_843951
Protein GI	116754833
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAACTATC TGGCGAGGCT GATTGAGGGG CAGAATCTCA CCATAGAGGA GGCAGAATCT 
CTCCTGGGCG CGTTCTTCGA TGGCGCTACC GATGCGCAGA TCGCCTCAGC TCTTACCGCT 
CTGAGGATGA AGGGTGAGAC TGCTGAGGAG CTCGCAGGTA TGGCAAAGAG GATGCGTGAG 
TCCGCGATCC GAATACGCCC CAGGGTCTCC GGAACGCTGG TCGATACATG CGGGACTGGT 
GGGGACAGCA CAAACACGAT AAATGTGAGC ACAGCAGCCG CGATAGTTGC AGCAGCGTGC 
GGCGTGCCAG TCGCGAAGCA CGGGAACTAC GCTGTGAGCT CACGATGCGG AAGCGCCAAC 
GTCCTCGAGG CTCTGGGTGT CAACATCTCC TGCCCTCCTG AGAGGGTGGA GAGCATCATA 
GAGTCTGTCG GGATCGGGTT CATGCTCGCC CCGCTCTTTC ATCCGGCGAT GAAGCGCGTA 
GCGCATATCA GAAAGGAGAT GGGGATCAGG ACCGTGTTCA ACGTTCTTGG GCCGCTCACA 
AATCCGGCAG GTGCTGAGGC TCAGGTCGTG GGGGTGTACT CACCAGCACT CTGTGAGAAG 
ATCGCAAATG TTCTGAACCT TCTCGGAACT AAACGGGCGA TGGTTGTGCA CGGCAGCGGT 
CTTGACGAGA TATCAAACAC AGGCAGCACC TTCGTCTCCG AGCTGTGCGA TGGGGTGGTG 
AGAAACTACG TTGTGGATCC CCGGGATCTT GGGTATCCGC TCGCAGATCT GAATGAGATC 
GCTGGAGGGA CTCCTGATGA GAACGCGGAG CGTCTCGTGA GGATATTGAA GGGCGAGAAG 
AGCAGGGCGA GGGAGCTGGT GGCGATGAAC GCAGGCGCAG CAGTGTACGT CTCGGGAATC 
GCATCCAGCC TGAGAGAGGG GTGCGCGATC GCAGAGGGCG CCATAAGCTC CGGTAGCGCT 
CTGGAGACCC TGAAGACCCT GGTCGAGGAG AACGGGGATC CTGGAAGGCT CAGGAGATTC 
CTGTGA

Protein sequence

MNYLARLIEG QNLTIEEAES LLGAFFDGAT DAQIASALTA LRMKGETAEE LAGMAKRMRE 
SAIRIRPRVS GTLVDTCGTG GDSTNTINVS TAAAIVAAAC GVPVAKHGNY AVSSRCGSAN 
VLEALGVNIS CPPERVESII ESVGIGFMLA PLFHPAMKRV AHIRKEMGIR TVFNVLGPLT 
NPAGAEAQVV GVYSPALCEK IANVLNLLGT KRAMVVHGSG LDEISNTGST FVSELCDGVV 
RNYVVDPRDL GYPLADLNEI AGGTPDENAE RLVRILKGEK SRARELVAMN AGAAVYVSGI 
ASSLREGCAI AEGAISSGSA LETLKTLVEE NGDPGRLRRF L