Gene A9601_00021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_00021
Symbol
ID	4716684
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	2038
End bp	4377
Gene Length	2340 bp
Protein Length	779 aa
Translation table	11
GC content	32%
IMG OID	640077699
Product	phosphoribosylformylglycinamidine synthase II
Protein accession	YP_001008397
Protein GI	123967539
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0046] Phosphoribosylformylglycinamidine (FGAM) synthase, synthetase domain
TIGRFAM ID	[TIGR01736] phosphoribosylformylglycinamidine synthase II

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAAATC ATGAAAATAA TGATCTATTT GATCTTAATG AAGCATTAAA AGTTGAAAAT 
TTAACACTTA ATGATTACGA AGAAATTTGC AAAAGATTAA AGAGAAAACC TAATAGAACG 
GAATTAGGCA TGTTTGGCGT TATGTGGTCT GAACATTGTT GTTATAGAAA TTCAAAACCT 
TTACTATCTA AGTTTCCTAC TAAAGGTAAA AATGTTTTAG TTGGACCTGG AGAAAATGCT 
GGCGTTATTG ATGTTGGAAA TAATCAAAAA CTTGTTTTTA AAATAGAAAG TCATAATCAT 
CCATCTGCTA TTGAACCTTT TCAAGGCGCA GCAACAGGTG TAGGAGGAAT TTTAAGAGAT 
ATATTTACAA TGGGTGCAAG GCCAATAGCA GTGTTGAATT CATTGAGATT TGGTAACCTT 
GATAAATCAT CAAATGTTGA TTTACTACGA GGAGTTGTAT CGGGTATTGC ACATTATGGA 
AATTGTGTAG GGGTGCCTAC TGTTGGAGGT GAAATTGACT TCGATGATAG TTACTCTGGA 
AATCCTCTAG TGAATGTCAT GGCTTTAGGA CTTTTAGAGA CCGAGGAAAT CGTTTGTTCT 
GGAGCTAAAA ATGTAGGATC ACCAGTATTA TATGTTGGTA ATACAACTGG CAGAGACGGT 
GTTGGAGGTG CTAGTTTTGC TAGTTCAGAA TTAACTACAA CTTCATTGGA TGATCGACCT 
GCAGTTCAGG TAGGTGATCC ATTTATTGAG AAAAGTCTTA TTGAAGCTTG TTTGGATGCT 
TTCAAGACAG GGGATGTAAT TGCAGCTCAA GATATGGGTG CTGCAGGTTT AACATGCAGT 
AGCGCAGAAA TGGCCGCAAA TGGAAATTTA GGGATATCTA TTGATTTAGA TTTGGTCCCT 
TCTAGAGAAG ATGATATGTC TTCATATCAA TATTTATTAT CTGAATCGCA AGAAAGAATG 
TTGTTTGTGG TTAAGGAAGA AAAAATTAGT GATCTTATTG AAAAATTTAA TAAATGGGGA 
TTATATGCCA GTGTTATTGG TGAAGTTATA GGAACTAATG AGGTAATTAT TTCTCATAAA 
GGTAATATTG TGGCCCAAAT ACCTACTTCT GCCTTATCTG ATGATACTCC TGTAAATTTT 
CACAATGTGA TTAATAATCC ACCCGACGAT CTTTTAAATA AATGGGAATG GAAAGAAAAT 
GATTTACCAG AAATTAACGA GCAAAAAATA TTTTCATTGA AGGAAAATAA AAAATTTTCT 
TTTTCAGAAA TCATTTTAAA GCTACTCTCT AATCCATCAA TAGCTTCTAA AAGATGGATT 
TATAAACAAT ATGACTCTCA AGTACAAGCA AATACAGTAT TTACACCTGG AAAATCAGAT 
GCAGCTGTAG TAAGACTAAG GGAACAAAAT AAAAAAAGTA AAAATAAAGT ATTTTCTGGT 
GTTGCTGCTT CAGTTGATTG TAATAGTAGA TGGGTTGCGC TTGATCCTTT TAGAGGATCT 
ATCGCTGCTG TAGCAGAATC AGCTAGAAAT GTTAGTTGTG TTGGTGCTGA ACCAGTAGCA 
ATTACAAATA ATTTAAATTT TTCTTCTCCT GAGAATGAAA TAGGATATTG GCAACTCTCA 
TCTTCATGTA ATGGAATTGC TGAAGCCTGT AAAGCTTTAG AAACTCCTGT TACAGGAGGT 
AATGTATCTT TATATAATGA ATCAAAAAAT AAAGATAATC TAATTACTCC TATTAATCCT 
ACTCCTGTTA TTGGAATGGT TGGAAAGATA GATAATGTCG AAAAAGCTAT AAGTAGTGAA 
TGGAAAAATA TTGAAGATCA AATCTGGTTA ATTGGTTCTT ATAAATCAGA TACGACAACT 
GCAGCTAGTT CTTATTTGGA ATATTTTCAT GGAGAAATTA CAGGTCGGCC TCCAAAAATA 
GATTTGTCGG ATGAAAAGTT TTGTCAGAGT TTTTTAAGAA ATGCGATTTT AAACAGTCTT 
GTAGTTTCTT CTCACGATAT AAGTGACGGA GGTTTAGCTA TAGCTTTAGC AGAGTCTTGT 
ATTTTGTCCG CAAGGGGTGC AACTATAGAA TTAGAGAAAG ATTTAAATAG AGTTGATAAT 
TTATTATTTG CCGAAGGGGG GTCAAGAATT ATTTTTTCAA TTAGTAAAAT GAAACAAAAT 
GAATGGTTTA ATTATTTAAA ACAAAATCAA ATAAATTTTC CATCAAGTGT TTATGTAAAA 
AAAATAGGAT ACGTATCTAG TGATACGCTG AAGATAAAAA TCAACGAAAA AAATATTTGC 
AATATTAGGG TTGAGGAATT AACCGAAAAA TTTAATAATA GTATTTCAGA TTACTTTTAA

Protein sequence

MINHENNDLF DLNEALKVEN LTLNDYEEIC KRLKRKPNRT ELGMFGVMWS EHCCYRNSKP 
LLSKFPTKGK NVLVGPGENA GVIDVGNNQK LVFKIESHNH PSAIEPFQGA ATGVGGILRD 
IFTMGARPIA VLNSLRFGNL DKSSNVDLLR GVVSGIAHYG NCVGVPTVGG EIDFDDSYSG 
NPLVNVMALG LLETEEIVCS GAKNVGSPVL YVGNTTGRDG VGGASFASSE LTTTSLDDRP 
AVQVGDPFIE KSLIEACLDA FKTGDVIAAQ DMGAAGLTCS SAEMAANGNL GISIDLDLVP 
SREDDMSSYQ YLLSESQERM LFVVKEEKIS DLIEKFNKWG LYASVIGEVI GTNEVIISHK 
GNIVAQIPTS ALSDDTPVNF HNVINNPPDD LLNKWEWKEN DLPEINEQKI FSLKENKKFS 
FSEIILKLLS NPSIASKRWI YKQYDSQVQA NTVFTPGKSD AAVVRLREQN KKSKNKVFSG 
VAASVDCNSR WVALDPFRGS IAAVAESARN VSCVGAEPVA ITNNLNFSSP ENEIGYWQLS 
SSCNGIAEAC KALETPVTGG NVSLYNESKN KDNLITPINP TPVIGMVGKI DNVEKAISSE 
WKNIEDQIWL IGSYKSDTTT AASSYLEYFH GEITGRPPKI DLSDEKFCQS FLRNAILNSL 
VVSSHDISDG GLAIALAESC ILSARGATIE LEKDLNRVDN LLFAEGGSRI IFSISKMKQN 
EWFNYLKQNQ INFPSSVYVK KIGYVSSDTL KIKINEKNIC NIRVEELTEK FNNSISDYF