Gene Cpha266_1891 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_1891
Symbol	purT
ID	4570850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	-
Start bp	2192007
End bp	2193176
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	57%
IMG OID	639766473
Product	phosphoribosylglycinamide formyltransferase 2
Protein accession	YP_912331
Protein GI	119357687
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0027] Formate-dependent phosphoribosylglycinamide formyltransferase (GAR transformylase)
TIGRFAM ID	[TIGR01142] phosphoribosylglycinamide formyltransferase 2

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.216866
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAAAA AAATCATGCT GCTGGGCAGC GGGGAGCTGG GCAAGGAGTT TGTGATTGCC 
GTTAAACGTC TGGGACACTT TGTGATTGCC GTTGACAGCT ATAATGATGC TCCTGCGCAG 
CAGGTGGCTG ACCGGCGTGA GGTGATCAAT ATGCTCGACG GCGCGGCTCT CGATGCCATC 
GTTGCCCGGC ATCAGCCCGA TGTGATCGTG CCTGAAATCG AGGCTATTCG TACCGAGCGG 
TTTTACGATT ATGAAAAAGA GGGGATACAG GTTGTTCCTT CGGCCCGTGC CGCCAATTTC 
ACCATGAACC GGAAAGCTAT TCGCGATCTG GCTTCGAAAG AGCTTGGTCT TCGAACGGCG 
ACGTATCGTT ACGCAGCGTC GAAGGAAGAG CTGAAGAGGG CGATAGGGGA GGTGGGAGTT 
CCCTGTGTGG TAAAACCGCT GATGAGCTCG TCGGGCAAGG GGCAGTCAAC CGTTAAAACG 
GAGGCTGACA TTGAACATGC CTGGAGCTAT TCGCAAAGCG GCAGGCGCGG TGATAGTGTG 
GAGGTGATTG TTGAGGCCTT TGTGCCGTTC CATACCGAGA TTACGCTCTT GACCGTCACG 
CAAAAAAACG GCCCGACGCT TTTCTGTCCG CCCATCGGGC ACCGTCAGGA GCGGGGTGAT 
TATCAGGAGA GCTGGCAGCC CTGCCGAATC GGCGATGCGC AGTTGCATGA AGCTCAGGAG 
ATCGCTGAAA AAGTGACTCG TTCGCTGACA GGTGCGGGGA TCTGGGGTGT GGAGTTTTTT 
CTGGCCGATG ACGGGCTTTA TTTTTCGGAG CTCTCCCCCC GTCCGCACGA TACCGGCATG 
GTGACGCTGG CTGGTACGCA GAACTTTACG GAGTTCGAGC TTCATGCGCG GGCGGTTTTA 
GGGCTTCCGA TTCCGAAGAT CGAACTGCTG CGGGTGGGTG CGAGCGCTGT GGTGTCAGCC 
GACAGAGAGG GGAAGAACCC TGATTACAGC GGCCTTGAAG AGGCTCTCGG TGAGCCTTGC 
ACCGATATTC GTATTTTCGG AAAACCGGCA ACCCGCCCTT ATCGCCGAAT GGGCGTAACG 
CTCGCTTACG ACGAACCGGG CAGCGATGTC GATACGGTGA AGGCGAAAGC CATTGCCAAT 
GCCCGCAAGG TGAGGGTGAC GAGCGAGTAG

Protein sequence

MQKKIMLLGS GELGKEFVIA VKRLGHFVIA VDSYNDAPAQ QVADRREVIN MLDGAALDAI 
VARHQPDVIV PEIEAIRTER FYDYEKEGIQ VVPSARAANF TMNRKAIRDL ASKELGLRTA 
TYRYAASKEE LKRAIGEVGV PCVVKPLMSS SGKGQSTVKT EADIEHAWSY SQSGRRGDSV 
EVIVEAFVPF HTEITLLTVT QKNGPTLFCP PIGHRQERGD YQESWQPCRI GDAQLHEAQE 
IAEKVTRSLT GAGIWGVEFF LADDGLYFSE LSPRPHDTGM VTLAGTQNFT EFELHARAVL 
GLPIPKIELL RVGASAVVSA DREGKNPDYS GLEEALGEPC TDIRIFGKPA TRPYRRMGVT 
LAYDEPGSDV DTVKAKAIAN ARKVRVTSE