Gene A9601_10931 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_10931
Symbol	purT
ID	4717804
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	934894
End bp	936069
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	31%
IMG OID	640078808
Product	phosphoribosylglycinamide formyltransferase 2
Protein accession	YP_001009484
Protein GI	123968626
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0027] Formate-dependent phosphoribosylglycinamide formyltransferase (GAR transformylase)
TIGRFAM ID	[TIGR01142] phosphoribosylglycinamide formyltransferase 2

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.673369
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGAAT CAATTTTTTC TAAAAAGAGA ATTTTATTAC TTGGTAGTGG CGAGCTTGGA 
AAAGAATTAG TAATAGAATC CAAAAGATTA GGATTAGAAG TCATTGCAAT TGATCGATAT 
GAAAAAGCTC CTGCTATGCA AGTTGCTGAT TATTCAAGAG TAATTGAAAT GGGAGATAAA 
AATATTTTAA AAAATGTAAT AAAAGAATTT AAGCCTGACT ATGTTGTCCC AGAAATAGAG 
GCACTTTCAA TTGAAGCCCT AAAAGAACTC GAGGATGAAG GATTCAATAT TGTTCCCAAT 
GCTAGAACTG TAGAAATTAC AATGAATAGA GATAAAATTA GAGACTTAGC TTCTAAAGAT 
TTAAAAATTA AAACTGCAAA GTTTGATTAT ATTTTTGAAT TTGATGATTT AGAAAAAAAA 
GCAGATGAAA TTGGATTCCC ACTTTTACTT AAACCTTTAA TGAGCTCTTC AGGAAAAGGG 
CAAAGTTTGG TTGAAACAAA AAATGATTTA CAAAATGCTT GGAAACAGGC ACAAGCAAAT 
TCAAGAGGAA AGGTTAAAGG TGTAATTATT GAAGAATTTA TTAATTTTGA TTTTGAGTTT 
ACTCTTTTAA CTGTAAGAAA AGAAAATGGT GAAAATATTT TTTGTTTACC AATTGGACAT 
CTTCAATCTA ATGGAGACTA TCAATGTAGT TGGCAACCTT TAGAGATCAA GGAGTCCTTA 
ATTATTGAAG CTAAGAGAAT GACTAGTAGA ATATTAAATA ACCTTAATGG AGCTGGATTA 
TACGGAGTAG AATTTTTTAT AAAAGGAAGT GAGGTTATCT TTTCAGAATT ATCTCCAAGA 
CCTCACGACA CTGGTATGGT TACATTAGTT AGTCAAAATA TTAATGAATT TGAATTACAT 
TTAAGGGCTT TTTTAAATTT ACCAATACCG CGTATCGATC TAATAGAGCC CTCTGCAACC 
AGAGTTATAC TCTCTAACCA AGAGTATCTA AATCCTATTT ATGAGGGTCT TTATGAAGCA 
TTAGAATTTG AAAAGACCAA AGTGCTCATA TTTGGCAAAC CAGTTTCCAG AAAAGGCAGA 
AGAATGGGTG TTGTTCTCTC TTCAAATACT GACATAAATT TGGCCAGAAA AAATGCAGAT 
GAAGCTGCTC TTAAAATAAA AGTCAGTACT ACATAA

Protein sequence

MKESIFSKKR ILLLGSGELG KELVIESKRL GLEVIAIDRY EKAPAMQVAD YSRVIEMGDK 
NILKNVIKEF KPDYVVPEIE ALSIEALKEL EDEGFNIVPN ARTVEITMNR DKIRDLASKD 
LKIKTAKFDY IFEFDDLEKK ADEIGFPLLL KPLMSSSGKG QSLVETKNDL QNAWKQAQAN 
SRGKVKGVII EEFINFDFEF TLLTVRKENG ENIFCLPIGH LQSNGDYQCS WQPLEIKESL 
IIEAKRMTSR ILNNLNGAGL YGVEFFIKGS EVIFSELSPR PHDTGMVTLV SQNINEFELH 
LRAFLNLPIP RIDLIEPSAT RVILSNQEYL NPIYEGLYEA LEFEKTKVLI FGKPVSRKGR 
RMGVVLSSNT DINLARKNAD EAALKIKVST T