Gene Syncc9902_1052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Syncc9902_1052
Symbol
ID	3742475
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus sp. CC9902
Kingdom	Bacteria
Replicon accession	NC_007513
Strand	+
Start bp	1016752
End bp	1017951
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	54%
IMG OID	637771227
Product	phosphoribosylaminoimidazole carboxylase ATPase subunit
Protein accession	YP_377060
Protein GI	78184625
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0026] Phosphoribosylaminoimidazole carboxylase (NCAIR synthetase)
TIGRFAM ID	[TIGR01161] phosphoribosylaminoimidazole carboxylase, PurK protein

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.19177
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAGTG CTGAGCCAGG GATGTCCTCT TCGGACACGA TGATCGGTGT AGTGGGTGGC 
GGTCAGCTGG CGAGAATGCT GGTGCAAGCT GCTTCTGCGC GTTCGATACC GATCGCAGTC 
CAAACCATCT CCGCGAGTGA CCCTGCTGCT GAGGCTGCGG CCCGCGTTGT GGAAGCTGAT 
CCCCGTGATG TAGCAGGAAC GCGCGAGTTG GTGGAGGGTT GCGAAGGCAT CACTTTCGAA 
AATGAGTGGG TCAATATCGA CGCGTTGATT CCCCTCGAAC AGCAGGGCGT TCGCTTTCGT 
CCCTCTCTGG CGTCTCTTGC TCCACTGGTC GACAAGTTGT CTCAGCGAAA GTTGTTGGAC 
GACTTAGCGA TACCCAGTCC ACCTTGGTGT CCCCTAAGCC TGATTTCTCC AGCGCAACCA 
TCTCTACCTC CGGGATGGAA TTTTCCGGTG ATGGCGAAAG CGGCCCGCGG TGGATACGAC 
GGAAAGGGAA CGATTGTTCT GAAAAATATT GATGCTCTGG CTCAGTTGCT CCGATCCGTC 
GATATTTCCG ATTGGCTTTT AGAAACGTGG GTGCATTACG AGCGTGAGCT GGCCCTTGTG 
GTGAGCCGAG ATTCCCAGGG TCGTCTTCGG AGCTTCCCAC TGGTGGAAAC GCACCAACAT 
GATCAAGTTT GCAACTGGGT TTTGGCACCA GCAGGAGTGG ACCAGGATGT TGAAGCTCTC 
GCTTACAACG TTGCTGCTTC CTTGCTCACC AAATTGAATT ACGTGGGTGT GTTGGCCCTT 
GAATTCTTTT ATGGACCTGC CGGTTTACAG GTGAATGAGA TTGCGCCTCG TACCCACAAC 
TCTGGTCATT TCTCAATCGA AGCTTGTACC AGCAGCCAGT TTGATCAACA AGTGTGCATT 
GCAGCGGGTC TTCCCGTACC TACGCCAGAA CTGAGGAGTG ATGGCGCATT GATGGTGAAT 
CTTTTGGGCC TTAATCCAAC CCAAGCTGCC CCGCTCGAGC AGAGATTGAC TGCGCTTCGT 
GAAATCCCCA ATGCACATCT TCATTGGTAT GGAAAATCAC CTGAAACCCC AGGCCGCAAA 
CTCGGCCACA TCACTGTGTT GTTGAACGCC AGTGATGCAG AACATCGTGA TCGGCAAGCG 
AAGGACGTTT TGACTGTTGT GCGAGGAATA TGGCCCGAGT TTCCCTCAGT TCAGGACTAA

Protein sequence

MSSAEPGMSS SDTMIGVVGG GQLARMLVQA ASARSIPIAV QTISASDPAA EAAARVVEAD 
PRDVAGTREL VEGCEGITFE NEWVNIDALI PLEQQGVRFR PSLASLAPLV DKLSQRKLLD 
DLAIPSPPWC PLSLISPAQP SLPPGWNFPV MAKAARGGYD GKGTIVLKNI DALAQLLRSV 
DISDWLLETW VHYERELALV VSRDSQGRLR SFPLVETHQH DQVCNWVLAP AGVDQDVEAL 
AYNVAASLLT KLNYVGVLAL EFFYGPAGLQ VNEIAPRTHN SGHFSIEACT SSQFDQQVCI 
AAGLPVPTPE LRSDGALMVN LLGLNPTQAA PLEQRLTALR EIPNAHLHWY GKSPETPGRK 
LGHITVLLNA SDAEHRDRQA KDVLTVVRGI WPEFPSVQD