Gene Clim_1707 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1707
Symbol	purT
ID	6353769
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	1877842
End bp	1879041
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	57%
IMG OID	642669312
Product	phosphoribosylglycinamide formyltransferase 2
Protein accession	YP_001943728
Protein GI	189347199
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0027] Formate-dependent phosphoribosylglycinamide formyltransferase (GAR transformylase)
TIGRFAM ID	[TIGR01142] phosphoribosylglycinamide formyltransferase 2

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.0749454
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGAAAA CAATCATGCT GCTCGGCAGC GGAGAACTGG GCAGGGAGTT CGTTATTGCG 
GCAAAACGTC TTGGGCAATA CGTGATTGCT GTCGACAGCT ATAACAATGC GCCGGCGCAG 
CAGGTTGCCG ACGAGCGCGA AGTGATCGAC ATGCTGGACG GCAATGCTCT CGATGCTTTG 
GTGGCCAGGC ACCGACCCGA TATGATCGTG CCTGAAATCG AGGCCATCCG CACCGAACGA 
TTCTACGACT ATGAGGAGCA GGGAATACAG GTGGTGCCTT CGGCACGTGC CGCGAATTTT 
ACGATGAATC GGAAGGCCAT TCGTGATCTC GCTTCAAAGG AGCTTGGCCT TCGTACTGCC 
AGATACCGAT ACGCGGCTTC TCTCGAAGAA CTGCGGACTT CCGTTTCGGA GGTGGGAATT 
CCCTGCGTGG TGAAACCGCT GATGAGCTCG TCGGGCAAGG GGCAGTCAAC GGTTAAAACA 
GAAGAGGATA TTGAACGCGC ATGGAGCTAT TCGCAGAGCG GTCGGCGCGG GGATATTGCC 
GAAGTGATCG TGGAGGCTTT TGTGCCGTTT CATACCGAGA TCACCCTGTT GACCGTAACG 
CAGAAAAACG GCCCGACGCT GTTCTGCCCG CCCATAGGGC ACCGTCAGGA GCGGGGCGAT 
TATCAGGAGA GCTGGCAGCC CTGCCGAATC GCGGATGCGC AGTTGCATGA GGCTCGGGAG 
ATCGCTGAAA ACGTAACTCA TTCGCTGACA GGCGCGGGTA TCTGGGGTGT GGAGTTTTTC 
CTTGCCGATG ACGGGCTCTA TTTTTCGGAA CTCTCGCCCC GTCCGCACGA TACCGGCATG 
GTGACGCTGG CTGGTACGCA GAATCTCACG GAGTTCGAGC TTCATGCCCG TGCTGTGCTC 
GGGCTTCCGA TTCCGGAAAT CGAATTGCTG CGGGTGGGCG CAAGTGCGGT TGTTCTTGCC 
GGCAGCGAGG GGGAGAACCC CGTCTATACC GGTCTGGAGG ATGCCCTCAG GCAGGCCGGT 
ACCGACATCC GCATTTTCGG AAAACCGACA TCACGCCCAT ACAGGCGAAT GGCCGTGACT 
CTGGCTTACG ACCGGCCGGG AAGCGATGTC GACGCAGTGA AAGAAAAAGC TGTCGCCAAT 
GCAGGTAAAG TTAGGGTAAT AAGCGAGCAG ACGTCCGGGT TCCCGTCAGG CAAGGGATAG

Protein sequence

MMKTIMLLGS GELGREFVIA AKRLGQYVIA VDSYNNAPAQ QVADEREVID MLDGNALDAL 
VARHRPDMIV PEIEAIRTER FYDYEEQGIQ VVPSARAANF TMNRKAIRDL ASKELGLRTA 
RYRYAASLEE LRTSVSEVGI PCVVKPLMSS SGKGQSTVKT EEDIERAWSY SQSGRRGDIA 
EVIVEAFVPF HTEITLLTVT QKNGPTLFCP PIGHRQERGD YQESWQPCRI ADAQLHEARE 
IAENVTHSLT GAGIWGVEFF LADDGLYFSE LSPRPHDTGM VTLAGTQNLT EFELHARAVL 
GLPIPEIELL RVGASAVVLA GSEGENPVYT GLEDALRQAG TDIRIFGKPT SRPYRRMAVT 
LAYDRPGSDV DAVKEKAVAN AGKVRVISEQ TSGFPSGKG