Gene Msed_0534 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_0534
Symbol	purT
ID	5103694
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	491129
End bp	492316
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	50%
IMG OID	640506438
Product	phosphoribosylglycinamide formyltransferase 2
Protein accession	YP_001190633
Protein GI	146303317
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0027] Formate-dependent phosphoribosylglycinamide formyltransferase (GAR transformylase)
TIGRFAM ID	[TIGR01142] phosphoribosylglycinamide formyltransferase 2

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0760232
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATTTG GAACCCCATT GGTGGGAAAC GGAAAGAAGA TTCTCCTTCT TGGTAGCGGT 
GAACTGGGTA AGGAGATGGT CATAGAGGCA CAGAGGATGG GAATAGAGAC TGTAGCTGTG 
GATAGATATG ATATGGCACC AGCCATGCAT GTTGCACATA GGAAATACGT TGTGGACATG 
CTCAATGGTA GCGCAATTAG GGCAATAATC AAGAGAGAGA ACCCAGACGC GGTGATAGCG 
GAGATAGAGG CCATTGACAC TGACGCATTG CTTGACCTTG AGGATCAGGG AGTCAGGGTG 
ATACCCAACG CAAACGCTGT GAAGACATGT ATGAACAGGA TGCAGTTAAG GAAGCTGGCT 
GCGGAAAAGG TAGGCGTGCC CACAACTAGG TACGCCTTTG CGAGCGACGA GGAGGAGGCG 
AGAAGGGCGT GTAAAGAGGT TGGATTTCCG TGCCTCCTGA AACCCGAGAT GAGCTCCAGC 
GGTCATGGTC ACGTTCTGGT GAAATCAGAG GATGAGGTGG AGAAGGGCTT CAGGGAATCG 
GTATCCCATG CTAGAGGTAA GAGCAGAACT GTAATAGTTG AAGAGTACGT CAAGGTGGAC 
ACCGAGCTCA CCGTTCTCAC CTATCGTCAC ATGAATAACG GATCCATAGA GACCAGAACC 
ATTGAACCCA TAGAGCATCA AAGGCCCAGC TACTATTACG TCGAGTCATG GCAACCATCC 
ACGGTGAGCC AGGAGGTTAT TGCAAGGTCA AGGGAATACG CCACTAGGGT GGTGAACGAG 
TTGGGTGGTC TCGGGATATT TGGGGTGGAG ATAATTGTCT CAGGGAACAG GGTACTTTTC 
AGTGAAGTAT CGCCGAGGCC ACATGATACA GGCCTCGTCA CCCTGGCCAG TCAAGACATC 
AGTGAGTTTC AGATTCATGT TAGGGCAGCA TTGGGTTTAC CTATACCTCA GGTGAGGGTA 
TTAACGCCAG CAGCCTCCCA TGTGATCCTC GCCCAATATG AGACTTGGGC TCCATCCTAC 
CTGAACGTGG AGAAGGCCCT CTCTATTCCA GGTGTTCAGG TTAGATTCTT CGGCAAACCT 
TCAACCTATG ACAAGAGGAG AATGGGAGTG GTACTAGCAA ACGGAAATGA TGTGAATGAG 
GCAAGGGACA AGGCGAGAAA GGCTTCCTCC CTCATCCTTG TTAAGTAA

Protein sequence

MEFGTPLVGN GKKILLLGSG ELGKEMVIEA QRMGIETVAV DRYDMAPAMH VAHRKYVVDM 
LNGSAIRAII KRENPDAVIA EIEAIDTDAL LDLEDQGVRV IPNANAVKTC MNRMQLRKLA 
AEKVGVPTTR YAFASDEEEA RRACKEVGFP CLLKPEMSSS GHGHVLVKSE DEVEKGFRES 
VSHARGKSRT VIVEEYVKVD TELTVLTYRH MNNGSIETRT IEPIEHQRPS YYYVESWQPS 
TVSQEVIARS REYATRVVNE LGGLGIFGVE IIVSGNRVLF SEVSPRPHDT GLVTLASQDI 
SEFQIHVRAA LGLPIPQVRV LTPAASHVIL AQYETWAPSY LNVEKALSIP GVQVRFFGKP 
STYDKRRMGV VLANGNDVNE ARDKARKASS LILVK