Gene A9601_02541 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_02541
Symbol	pyrB
ID	4716938
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	236198
End bp	237214
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	34%
IMG OID	640077953
Product	aspartate carbamoyltransferase catalytic subunit
Protein accession	YP_001008649
Protein GI	123967791
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0540] Aspartate carbamoyltransferase, catalytic chain
TIGRFAM ID	[TIGR00670] aspartate carbamoyltransferase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.290207
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAATTT GGCCTCATAA ACATATACAC ACACTAGCTA ATTTTTCAAT TAAAGATTAT 
GAGTCAGTAT TTGAATTAGC TAATAGATTT GATGCACTAA AGAATGCAGG AACAAAAAAG 
ATACCGGCTT TACAAGGGAC TTTGGTAACT TCTTTATTTT TTGAAGCAAG TACAAGAACA 
AAAAATAGTT TTGAGCTTGC AGCAAAAAGA CTTTCTGCTG ATGTCCAAAC GTTTGCGCCA 
TCCTCCAGCT CTTTAACAAA AGGCGAAACA ATAATTGATA CCGCTATAAC TTATTCAGCT 
ATGGGGGCGG ATACATTAGT TATCAGACAT TCATCAAGTT ACATAACCTT TGAAATCGCA 
AAAAAACTTG ATGCAATAAA TTCCAAGACA TCGGTTCTTA ATGCGGGAGA TGGATTACAT 
AGTCACCCCA GCCAAGGATT GCTTGACATC TATACATTGA TAAAATTCTT TTCCCCACAA 
ACATTGAATC CAGAGGTTTT AAATTCCAAA AAAATTTTAA TAATTGGAGA CGTAAATCAT 
TCAAGGGTTG CGAGGTCAAA TCTTTGGGCT TTAAGTGCAT TCGGCGCGGA TATAATCTTA 
TGTGGTCCTA AGGCATTAAT ACCTGATGAA TTTATCAATT TTTTAAAAAC CCCCGCGCCA 
AATCAAACAG AAGATCCTGT TAAATCAAGA GGTTCCATAA CAATTTCTAG ATCATTGGAA 
GAATCAATAA AAACTGCAGA TGCGATTATT GTTTTAAGAC TCCAGAAAGA GAGAATGATG 
GAAAATTTAC TAAGTAGCAT TGATTCATAT AGTTTGGATT ATGGCTTAAC CCCAGAGAAA 
TTATCTTTAA ATAATAAAGA AATTCCAATT CTACATCCTG GTCCCATTAA CAGAGATATT 
GAAATAAGCA GCAAAGTGGT AGATCGATAT CCTAATTGCT TAATAAATAA TCAAGTTGCA 
AATGGAATCC CCATAAGAAT GGCTTTGCTT TATCTATTAC AAAAACACAA CAAGTAA

Protein sequence

MQIWPHKHIH TLANFSIKDY ESVFELANRF DALKNAGTKK IPALQGTLVT SLFFEASTRT 
KNSFELAAKR LSADVQTFAP SSSSLTKGET IIDTAITYSA MGADTLVIRH SSSYITFEIA 
KKLDAINSKT SVLNAGDGLH SHPSQGLLDI YTLIKFFSPQ TLNPEVLNSK KILIIGDVNH 
SRVARSNLWA LSAFGADIIL CGPKALIPDE FINFLKTPAP NQTEDPVKSR GSITISRSLE 
ESIKTADAII VLRLQKERMM ENLLSSIDSY SLDYGLTPEK LSLNNKEIPI LHPGPINRDI 
EISSKVVDRY PNCLINNQVA NGIPIRMALL YLLQKHNK