Gene Paes_2331 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Paes_2331
Symbol	purT
ID	6459404
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prosthecochloris aestuarii DSM 271
Kingdom	Bacteria
Replicon accession	NC_011059
Strand	+
Start bp	2505511
End bp	2506692
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	57%
IMG OID	642726297
Product	phosphoribosylglycinamide formyltransferase 2
Protein accession	YP_002016969
Protein GI	194335109
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0027] Formate-dependent phosphoribosylglycinamide formyltransferase (GAR transformylase)
TIGRFAM ID	[TIGR01142] phosphoribosylglycinamide formyltransferase 2

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.659291
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATGC CGAAAAAAAT AATGCTGCTT GGCAGCGGGG AATTAGGAAA GGAGTTCGTT 
ATTGCCGCCA AACGGCTCGG GCAATTTGTG ATTGCGGTTG ACAGTTACCA TGACGCTCCG 
GCGCAACAGG TGGCCGATGA ACGTGAAGTG ATCGATATGC TTGACGCCGA GGCACTCGAC 
GCCATTGTGG CGAAACATAG TCCGGAGATC ATCGTGCCTG AAATCGAAGC TATCCGAACC 
GAGCGTTTCT ACGACTACGA ACAGCAGGGG ATACAGGTCG TGCCCTCGGC CCGGGCTGCG 
AATTTCACGA TGAACCGGAG AGCGATCCGT GACCTGGCAG CCAAAGAGCT GGGCTTGAGA 
ACGGCGGACT ACCGTTATGC GGCATCGTTC GAGGAACTGC AGCTCGCCAT TGAAGCGATC 
GGATTGCCCT GTGTCGTCAA ACCACTGATG AGCTCGTCGG GCAAGGGGCA GTCGGTCGTC 
AGAAACAGTG CCGATATCGG TCAGGCATGG GACTATTCGC AGAGCGGCAA GCGTGGCGAC 
AGTACAGAGG TAATCGTCGA AGCATTCGTC TCGTTCCATA CCGAGATCAC CCTCCTGACG 
GTAACGCAGC ACAACGGCCC GACGCTGTTC TGTCCTCCGA TCGGGCATCG TCAGGAACGG 
GGCGATTATC AGGAGAGCTG GCAGCCGTGC CTCATCGATG AAAAATATCT GCGACAAGCA 
GAGGAAATGG CTGACAAGGT GACCAGTTCG CTCGGCGGAG CGGGGATCTG GGGTGTCGAG 
TTTTTTCTTG CCGATGACGG CCTCTATTTC TCGGAACTTT CGCCCCGACC ACACGATACC 
GGCATGGTTA CGCTTGCAGG CACCCAGAAC CTGACGGAAT TCGAACTGCA TGCACGCACG 
ATCCTGGGAC TGCCGATTCC TGAAATCCAG CTCCTGCGCG CCGGAGCCAG CGCAGTGATT 
CTGGCTGACA GAGAAGGCGA CAATCCCCGA TTCACAGGCC TGAAAGAGGC GCTGACCGAT 
CCCGACACAG ACATTCGGAT CTTCGGAAAA CCGACAACCC GCCCATGCCG CCGCATGGGT 
GTAGCGCTGG TTTCAGGCAA GCCCGATGCC GATCTGGCGA GCCTCAAGCA ACAAGCCATC 
AGCAATGCCG CCAGAGTTAC CGTCGTCTGC GATGAGCGTT GA

Protein sequence

MTMPKKIMLL GSGELGKEFV IAAKRLGQFV IAVDSYHDAP AQQVADEREV IDMLDAEALD 
AIVAKHSPEI IVPEIEAIRT ERFYDYEQQG IQVVPSARAA NFTMNRRAIR DLAAKELGLR 
TADYRYAASF EELQLAIEAI GLPCVVKPLM SSSGKGQSVV RNSADIGQAW DYSQSGKRGD 
STEVIVEAFV SFHTEITLLT VTQHNGPTLF CPPIGHRQER GDYQESWQPC LIDEKYLRQA 
EEMADKVTSS LGGAGIWGVE FFLADDGLYF SELSPRPHDT GMVTLAGTQN LTEFELHART 
ILGLPIPEIQ LLRAGASAVI LADREGDNPR FTGLKEALTD PDTDIRIFGK PTTRPCRRMG 
VALVSGKPDA DLASLKQQAI SNAARVTVVC DER