Gene SNSL254_A2042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A2042
Symbol	purT
ID	6484155
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	1981288
End bp	1982466
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	57%
IMG OID	642737398
Product	phosphoribosylglycinamide formyltransferase 2
Protein accession	YP_002041148
Protein GI	194444508
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0027] Formate-dependent phosphoribosylglycinamide formyltransferase (GAR transformylase)
TIGRFAM ID	[TIGR01142] phosphoribosylglycinamide formyltransferase 2

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	0.489284
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCTAT TAGGCACTGC GCTGCGTCCG GCAGCAACGC GAGTGATGTT ATTAGGGGCA 
GGAGAATTAG GAAAAGAGGT GGCGATTGAA TGCCAACGCC TGGGGATCGA GGTTATCGCC 
GTCGATCGCT ATCCTGATGC TCCCGCCATG CATGTGGCTC ACCGTTCACA CGTCATTAAT 
ATGCTGGACG GCGAGGCGCT ACGTCATGTG ATTACAGAGG AAAAACCGCA TTATATCGTG 
CCGGAAATAG AAGCGATCGC CACCGATACG CTGCGCGAGC TGGAGGGCGA AGGGCTGAAT 
GTCGTGCCTT GCGCCCGTGC AACGCAGCTC ACGATGAACC GCGAAGGGAT CCGTCGCCTG 
GCCGCAGAAG AATTAGGACT GCCGACATCG ACGTATCGCT TTGCCGACAG TGAGGCCAGT 
TTTCATGATG CGGTAGCCGC AGTGGGTTTT CCTTGCATCG TCAAACCGGT CATGAGCTCT 
TCCGGCAAAG GCCAGAGCTT TATCCGCTCG GCCGAACAGC TCGCGCAGGC ATGGGAGTAT 
GCTCAACAGG GCGGACGCGC TGGCGCGGGT CGCGTGATTG TGGAAGGCGT GGTTAAATTT 
GATTTTGAAA TTACGCTGCT CACCGTTAGC GCCGTCGATG GCGTGCATTT CTGCGCGCCG 
GTCGGTCATC GTCAGCAAGA TGGTGACTAT CGCGAATCCT GGCAGCCACA GCAGATGAGC 
GAACTGGCGC TGAAGCGGGC GCAAGAGATT GCTCGTCATG TGGTACTGGC GTTAGGCGGT 
CATGGCCTGT TCGGCGTTGA ACTCTTCGTC TGTGGCGATG AAGTCATTTT CAGCGAAGTC 
TCCCCTCGCC CGCACGATAC CGGAATGGTC ACGTTGATTT CTCAGGATCT CTCTGAGTTT 
GCGCTGCATG TGCGCGCCTT TCTGGGAATG CCCGTAGGCG CTATTCGCCA GTATGGTCCC 
GCTGCCTCGG CCGTGATTCT GCCGCAGCTT ACCAGTCAAA ATGTGACGTT TGATAATGTA 
CACGCGGCGG TAGGAGCCGG AGTGCAGGTA CGGCTGTTTG GTAAGCCTGA GATCGACGGC 
AGCCGTCGTC TTGGTGTAGC GTTAGCGACA GGTGAAAACG TTGAAGAAGC GGTGATAAGA 
GCGAAAAAGG CCGCCAGCCG CGTGACGGTA AAAGGCTAA

Protein sequence

MTLLGTALRP AATRVMLLGA GELGKEVAIE CQRLGIEVIA VDRYPDAPAM HVAHRSHVIN 
MLDGEALRHV ITEEKPHYIV PEIEAIATDT LRELEGEGLN VVPCARATQL TMNREGIRRL 
AAEELGLPTS TYRFADSEAS FHDAVAAVGF PCIVKPVMSS SGKGQSFIRS AEQLAQAWEY 
AQQGGRAGAG RVIVEGVVKF DFEITLLTVS AVDGVHFCAP VGHRQQDGDY RESWQPQQMS 
ELALKRAQEI ARHVVLALGG HGLFGVELFV CGDEVIFSEV SPRPHDTGMV TLISQDLSEF 
ALHVRAFLGM PVGAIRQYGP AASAVILPQL TSQNVTFDNV HAAVGAGVQV RLFGKPEIDG 
SRRLGVALAT GENVEEAVIR AKKAASRVTV KG