Gene Syncc9902_2289 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Syncc9902_2289
Symbol
ID	3743443
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus sp. CC9902
Kingdom	Bacteria
Replicon accession	NC_007513
Strand	+
Start bp	2195974
End bp	2197044
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	58%
IMG OID	637772489
Product	hypothetical protein
Protein accession	YP_378290
Protein GI	78185856
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGACGATCG CAGAGGGTTC CGGCAAAGAA CGGTTCAAAA ACCACCTGCG CAAGGTGGGC 
AGCGGTGAAC ACACCAGCAA AGGTCTGAGT CGTGAAGAAG CTGCAGAAGC TCTCGATCTG 
ATGCTTCAGC AGGAAGCAAC CCCCGCTCAA ATCGGCGCTT TTCTGATTGC CCATCGCATC 
CGTCGCCCTG AGCCGCAGGA GCTCACGGGA ATGCTGGACA CGTATCGACA CCTTGGGCCG 
AAACTCCAAT CCAAAGCTGG CCAGACTCCG CCGGTGTGCT TCTGCATGCC CTTCGATGGA 
CGCACCCGGA CCGCCCCCAT CTATCCCCTC ACAACGTTGG TGCTTCTGGC GTTAGGTCAA 
CCCGTGGTGC TCCAAGGCGG GAATCGCATG CCAATCAAAT ATGGCGTGAC CGCCATCGAT 
CTGTTTCGAG AATTAGGCGT GGAGCTGAGC GGACTCCCCC TTGAAACAGT GCAAGACGGG 
CTGCAAACCA ACGGCTTCGC GTTGGTGCAT CAACCCGATC ACTTCGCTAT CGCCGAGAGC 
TTGATCACCT ATCGCGAAGA ATTGGGCAAA CGACCCCCCG TCGCCAGCCT TGAGCTGCTC 
TGGACCCCTC ATCAAGGCGC ACACCTCTTG ATCAGCGGTT TTGTTCACCC TCCAACCGAA 
AGTCGAGCAT GGGAAGCACT CCGCCTTGCG GAAGAAGCCC AGGTGGTCAC CGTCAAAGGC 
TTAGAAGGCG GAACCGACCT GCCAATTGGG CGCGCCTGCA TCACCGCAAA GGTTGATGGC 
GGTCACGCAC AACGTTTAAT TCTTCACCCG CGAGACCACG ACTGCTATGA AGCAGATCTG 
GAATGGACCG ATCCTGCAAC CTGGGCCCAA CAGGCCCTTG AAGCGCTCAA CAACAGTGGT 
CCCCTGCTCA GTGCCTTGCG TTGGAATGCT GGGGTCTATC TCTGGTTTGC TGGTCAGAGT 
GCAACCCTCG AGGCTGGTCT TGAACGTGCG CAAGAAGCCC TCGAAGGCGG CACAGCGCTA 
ACGGCCTTGC ATCAACTTCA GGCGTGGAGC AAGGCCTTGG CCATGCGATA G

Protein sequence

MTIAEGSGKE RFKNHLRKVG SGEHTSKGLS REEAAEALDL MLQQEATPAQ IGAFLIAHRI 
RRPEPQELTG MLDTYRHLGP KLQSKAGQTP PVCFCMPFDG RTRTAPIYPL TTLVLLALGQ 
PVVLQGGNRM PIKYGVTAID LFRELGVELS GLPLETVQDG LQTNGFALVH QPDHFAIAES 
LITYREELGK RPPVASLELL WTPHQGAHLL ISGFVHPPTE SRAWEALRLA EEAQVVTVKG 
LEGGTDLPIG RACITAKVDG GHAQRLILHP RDHDCYEADL EWTDPATWAQ QALEALNNSG 
PLLSALRWNA GVYLWFAGQS ATLEAGLERA QEALEGGTAL TALHQLQAWS KALAMR