Gene A9601_18991 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_18991
Symbol	pyrG
ID	4718638
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	1635109
End bp	1636719
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	34%
IMG OID	640079634
Product	CTP synthetase
Protein accession	YP_001010289
Protein GI	123969431
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0504] CTP synthase (UTP-ammonia lyase)
TIGRFAM ID	[TIGR00337] CTP synthase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.433411
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAAAAT TTGTATTTGT CACTGGAGGA GTAGTTTCTA GCATTGGTAA AGGGATTGTA 
GCTGCAAGCT TAGGAAGATT ATTAAAATCT AGAGGATATA GTGTTTCAAT ATTAAAACTA 
GATCCATATC TAAATGTTGA TCCAGGAACA ATGAGCCCTT TTCAACATGG AGAAGTATTT 
GTAACCGAAG ATGGGGCTGA AACCGATCTA GATTTAGGTC ACTACGAAAG ATTTACTGAT 
ACTGCAATGA CTAGGTTAAA TAGTGTGACT ACTGGATCTA TTTATCAAGC AGTTATTAAT 
AAAGAAAGAA GAGGCAATTA TAACGGTGGA ACTGTGCAAG TAATACCTCA CATAACGGGA 
GAAATTAGAG AAAGGATTCA TAGAGTAGCC GCTAACAGCA ATGCAGATAT TATTATTACT 
GAAATTGGTG GAACAGTTGG TGATATTGAA TCTCTACCTT TTTTAGAGGC AATAAGAGAA 
TTCAAAAATG ATGTCAATAG GAACGATGTT GCATACATAC ACGTAACATT ACTTCCTTAC 
ATCAAAACCT CTGGCGAAAT AAAAACTAAA CCAACACAAC ATTCAGTGAA AGAATTAAGA 
TCAATTGGAA TTCAGCCAGA TTTACTTGTA TGCCGAAGTG ATAAATCTAT CAATGAAGCT 
CTTAAAAAAA AGCTTAGTGG TTTTTGCGGT GTCAATATCA ACTCTGTAAT TGAAGCTTTA 
GACGCAGACA GTATATATTC TGTACCTCTT TCTTTAAAAA AAGAAGGTTT ATGCAAAGAA 
ACCTTGAAGT ATTTAGACCT TGAAGATAAA AAATGTGATT TGAAAAATTG GGAGCAACTA 
ATACACAACC TAAGAAATCC TGGAGATCCA ATAAAAGTTG CACTTGTAGG CAAATATATT 
GAACTTGGAG ATGCATATTT ATCCGTTGTT GAAGCTTTAA GACATGCATG CATTGAACAA 
AGGGCTTTAT TAGATTTACA TTGGGTAAGT GCTGAAATGA TAGAAAACAA TTCAGCAGAA 
ACTTACTTAA ATGAAGTTGA TGCAATTGTT GTACCCGGGG GATTTGGTAA TAGAGGAGTA 
AATGGAAAAA TTTCGGCTAT AAAATTCGCA AGAGAAAATA AAATTCCCTT TTTAGGTTTG 
TGCCTTGGCA TGCAATGTGC AGTTATTGAA TGGGCCAGGA ATGTAGCTAA TCTTCCAGAT 
GCATCTAGTT CAGAACTAGA CCCAAACACT CCAAATCCAG TGATACATTT ATTACCAGAA 
CAGGAAGATG TAGTTGATTT AGGTGGGACA ATGAGACTTG GAGTTTATCC ATGTAGACTG 
ACAAAAAATA CAACTGGAAA AAACTTATAT GATGAGGATG TTATTTATGA GAGACATCGG 
CATAGATACG AATTTAATAA TTACTACAAA CAAAGTTTTT TAGATTCTGG ATACAAAATT 
AGTGGTACAT CACCAGATGG CAGATTAGTT GAGTTAATTG AGTTAGAAAA TCATCCATAC 
TTCTTAGCCT GTCAATATCA TCCTGAGTTT TTATCAAGAC CTGGCAAACC TCATCCTTTA 
TTTAAAGGAT TAATAAAAGC CTCTCAAGAT AAGTTAACTC AATCAAATTA A

Protein sequence

MSKFVFVTGG VVSSIGKGIV AASLGRLLKS RGYSVSILKL DPYLNVDPGT MSPFQHGEVF 
VTEDGAETDL DLGHYERFTD TAMTRLNSVT TGSIYQAVIN KERRGNYNGG TVQVIPHITG 
EIRERIHRVA ANSNADIIIT EIGGTVGDIE SLPFLEAIRE FKNDVNRNDV AYIHVTLLPY 
IKTSGEIKTK PTQHSVKELR SIGIQPDLLV CRSDKSINEA LKKKLSGFCG VNINSVIEAL 
DADSIYSVPL SLKKEGLCKE TLKYLDLEDK KCDLKNWEQL IHNLRNPGDP IKVALVGKYI 
ELGDAYLSVV EALRHACIEQ RALLDLHWVS AEMIENNSAE TYLNEVDAIV VPGGFGNRGV 
NGKISAIKFA RENKIPFLGL CLGMQCAVIE WARNVANLPD ASSSELDPNT PNPVIHLLPE 
QEDVVDLGGT MRLGVYPCRL TKNTTGKNLY DEDVIYERHR HRYEFNNYYK QSFLDSGYKI 
SGTSPDGRLV ELIELENHPY FLACQYHPEF LSRPGKPHPL FKGLIKASQD KLTQSN