Gene Shewmr4_3020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_3020
Symbol	purT
ID	4253591
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	+
Start bp	3606924
End bp	3608099
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	53%
IMG OID	638119662
Product	phosphoribosylglycinamide formyltransferase 2
Protein accession	YP_735148
Protein GI	113971355
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0027] Formate-dependent phosphoribosylglycinamide formyltransferase (GAR transformylase)
TIGRFAM ID	[TIGR01142] phosphoribosylglycinamide formyltransferase 2

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.190979
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATAGGAA CTCCCTACAC AGAGGGCGCT CGACGCGCCA TGTTGCTTGG CTGCGGTGAG 
CTAGGTAAAG AAGTCGCCAT CGAGCTCCAA CGCTTAGGTG TTGAAGTGAT TGGCGTCGAT 
CGTTATCCCA ATGCCCCCGC CATGCAAATT GCCCATCGCT CCCATGTGAT CAATATGCTC 
GATGCAAAAG CGCTTCGCGC CATTATCGAG CTAGAAAAGC CCCACTTAGT GATCCCCGAA 
ATTGAAGCTA TTGCCACTCA AACCTTAGTT GAGATGGAAG CCGAAGGCCT CAATGTCGTG 
CCGACAGCGC GCGCAACTCA GCTGACCATG GACAGAGAAG GCATTCGTCG CCTCGCCGCC 
GAAACCTTAG GTCTGCCGAC CTCGCCCTAT TTCTTCTGCG ACACTGAAAC CGAATTTAAT 
CAAGCCATTG GCAAGATTGG CGTGCCCTGC GTAGTCAAAC CCGTGATGAG CTCATCGGGC 
AAGGGCCAAA GTGTTATCCG TGATGTATCC CAAAGCGCCA AAGCCTGGCA ATATGCCCAA 
GAAGGCGGCC GCGCGGGCGG TGGTCGTGTG ATTGTCGAAG GCTTTATCCC CTTCGATTAC 
GAAATTACCC TGCTGACCAT TAGCGCAGTC AATGGCATCC ACTTCTGCGC GCCAATTGGC 
CACAGGCAAG AAGACGGCGA CTACCGCGAG TCATGGCAAC CTCAAGCCAT GTCGGCCGAC 
GTGCTAGCAA AATCCCAAGC AATCGCCAGC AAAGTGGTGG AAGCCCTCGG CGGTTACGGC 
TTATTTGGGG TCGAGCTGTT TGTGAAGGGC AGCGATGTGT ACTTCTCTGA AGTCTCGCCT 
CGTCCGCACG ATACCGGTTT AGTCACCTTA ATTAGCCAAG ATTTATCCGA GTTTGCACTG 
CATGTCAGGG CAATTCTTGG CCTGCCGATT CCGAATATCC ATCAACATGG CCCCAGCGCC 
TCGGCGGTAG TATTGGTGGA AGGCAAATCG AAAAACATTC GCTATCAAGG TCTTGCCGAT 
GCCTTGGCGG CGGAAAATAC TCAGCTCAGA TTATTCGCTA AGCCTGAAAT CGATGGTCGC 
CGCCGTTTAG GGGTTGCCCT CGCCCGCGAT AAAGATATCG AAAGCGCAGT CAATAAAGCG 
CTGGATAGTG CATCTAAGGT AAAAGTGATT TTCTAG

Protein sequence

MIGTPYTEGA RRAMLLGCGE LGKEVAIELQ RLGVEVIGVD RYPNAPAMQI AHRSHVINML 
DAKALRAIIE LEKPHLVIPE IEAIATQTLV EMEAEGLNVV PTARATQLTM DREGIRRLAA 
ETLGLPTSPY FFCDTETEFN QAIGKIGVPC VVKPVMSSSG KGQSVIRDVS QSAKAWQYAQ 
EGGRAGGGRV IVEGFIPFDY EITLLTISAV NGIHFCAPIG HRQEDGDYRE SWQPQAMSAD 
VLAKSQAIAS KVVEALGGYG LFGVELFVKG SDVYFSEVSP RPHDTGLVTL ISQDLSEFAL 
HVRAILGLPI PNIHQHGPSA SAVVLVEGKS KNIRYQGLAD ALAAENTQLR LFAKPEIDGR 
RRLGVALARD KDIESAVNKA LDSASKVKVI F