Gene Syncc9902_1916 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Syncc9902_1916
Symbol
ID	3743796
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus sp. CC9902
Kingdom	Bacteria
Replicon accession	NC_007513
Strand	+
Start bp	1831933
End bp	1832970
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	56%
IMG OID	637772111
Product	phosphoribosylaminoimidazole synthetase
Protein accession	YP_377917
Protein GI	78185482
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.344897
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACTACA AGAGTGCAGG TGTTGATGTA GAAGCTGGAC GGGCTTTTGT TCAGCGCATC 
AAAGCTTCGG TAGAGGCCAC CCACCGCCCA GAAGTCGTGG GAGGTCTTGG CGGATTTGGC 
GGCCTCATGC GCCTTCCAAC TGGCCTGCGC AAACCTCTTC TCGTGTCCGG AACGGACGGA 
GTCGGCACCA AGCTGGAACT CGCCCAAAAT CATCACTGCC ATCACGGGGT GGGCATTGAT 
CTTGTTGCGA TGTGCGTCAA CGACGTGATT ACGTCTGGGG CCGCTCCACT GTTTTTCCTC 
GACTACATGG CCACAGGCGC CCTAAGCCCA GCCGCCATGG CCGAAGTGGT CGAGGGAATC 
GCAGATGGAT GCCGTCAGAG CGGTTGCGCA CTTCTAGGAG GCGAAACAGC AGAAATGCCC 
GGGTTTTATC CCCAAGGGAG ATACGACCTC GCCGGCTTCT GCGTTGCCGT CGTCGAGGAA 
GACGACCTCA TCGATGGACG ATCCATTTCC CCGGGGGATC AAATCATCGG CATCGCTAGC 
AGTGGTGTGC ACAGCAACGG ATTCAGCCTC GTCAGGAAGG TTTTAGAAAA AGCAGGCATC 
AACGAAAACA GCCAATACGG ACCAGACAAC AGACGACTCC TCAACGACCT GCTCGCGCCG 
ACAACGCTCT ACGCCTCACT TGTTCAAGAA CTGCTCAGCA ACGCCATCAA GATCCATGGC 
ATGGCCCACA TCACTGGCGG GGGATTGCCT GAAAATTTGC CCCGCTGTCT GCCGGAGGGA 
ATGACGGCCA AAATCGAGGC TGAGGCATGG CCTCGATCTC CTTTATTTCA GTGGCTGCAA 
TCCGCAGGAG CGATTCCAGA ACGTGATCTT TGGCATACGT TCAACATGGG AATCGGGTTC 
TGCCTCGTCG TTCCAAAAGA AGCGGAACAA ACTGCATTAG ATGTTTGTCA TTTGAACAAC 
CATCAGGCAT GGGTCATTGG TGAAGTGCTG AAGACCCCTC CAGGGGAGCA TTCAGCCTTA 
CAAGGGCTGC CCAGCTGA

Protein sequence

MDYKSAGVDV EAGRAFVQRI KASVEATHRP EVVGGLGGFG GLMRLPTGLR KPLLVSGTDG 
VGTKLELAQN HHCHHGVGID LVAMCVNDVI TSGAAPLFFL DYMATGALSP AAMAEVVEGI 
ADGCRQSGCA LLGGETAEMP GFYPQGRYDL AGFCVAVVEE DDLIDGRSIS PGDQIIGIAS 
SGVHSNGFSL VRKVLEKAGI NENSQYGPDN RRLLNDLLAP TTLYASLVQE LLSNAIKIHG 
MAHITGGGLP ENLPRCLPEG MTAKIEAEAW PRSPLFQWLQ SAGAIPERDL WHTFNMGIGF 
CLVVPKEAEQ TALDVCHLNN HQAWVIGEVL KTPPGEHSAL QGLPS