Gene Syncc9902_2040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Syncc9902_2040
Symbol
ID	3743000
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus sp. CC9902
Kingdom	Bacteria
Replicon accession	NC_007513
Strand	+
Start bp	1948992
End bp	1950086
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	57%
IMG OID	637772237
Product	chorismate synthase
Protein accession	YP_378041
Protein GI	78185607
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCAGCA GCTTCGGCGA TCTCTTCCGC ATCAGCACCT TCGGTGAATC CCACGGCGGA 
GGCGTTGGTG TGATTGTGGA GGGCTGCCCG CCAAGGCTGG AACTGGATTT AGACGAAATC 
CAAGCAGAAC TCAACCGTCG CAAACCAGGA CAAAGTCACA TCACCACACC CCGAAAAGAA 
GCCGATCAGG TGGAGATTCT GAGTGGCCTG CTGGACGGAA AAACCACCCT GGGCACCCCC 
ATTGCCATGT TGGTGCGTAA TAAAGATCAG CGACCCGGGG ATTACTCGGA CATGGCCGTG 
GCCTTTCGAC CCTCCCATGC AGATGCCACC TATCAATCCA AATACGGCAT CCAAGCCCGT 
AGCGGTGGCG GACGAGCATC AGCCCGAGAA ACCATTGGCA GAGTGGCGGC TGGCGCCATT 
GCCAAACAAC TTTTGCGTAA AGCAGCTGGA ACTGAAATCC TGGCGTGGGT GAAGCAGATT 
CACACAATCG AAGCCCATGG CATCGACCCA TCCACGGTTT CCATGAATGA CATTGAAGCC 
AACATTGTGC GCTGTCCAGA AGCCTCCGTG GCCAACCAGA TGATCGAGCG CATTGAGGCG 
ATTGGCCGAG AAGGCGATTC CTGCGGTGGA GTGATCGAGT GCGTTGTCAG GCAGCCTGCC 
GTGGGACTAG GGATGCCGGT CTTCGACAAA TTGGAAGCCG ATCTCGCCAA GGCGGTGATG 
TCGCTACCAG CCACGAAGGG ATTTGAGATC GGCTCAGGGT TTAGTGGAAC CCTCTTAAAA 
GGCAGCGAAC ACAATGACGC CTTCATCCCA GGAGACGATG GCCGCCTCCA TACCGCCACG 
AACAACTCCG GGGGCATCCA AGGCGGGATC AGCAACGGAG AACCGATCGT GATCAGAGTG 
GGATTCAAAC CAACGGCCAC CATTCGCAAA GAACAGCAGA CCATCGACTC TGATGGCAAT 
GCGACAACCC TGGCCGCAAA AGGGCGTCAC GACCCCTGCG TACTGCCTCG GGCCGTACCC 
ATGGTGGAAG CGATGGTGGC CCTGACGCTG GCAGATCATC TGCTCAGACA ACAGGGCCAA 
TGCAGCCTGT GGTGA

Protein sequence

MGSSFGDLFR ISTFGESHGG GVGVIVEGCP PRLELDLDEI QAELNRRKPG QSHITTPRKE 
ADQVEILSGL LDGKTTLGTP IAMLVRNKDQ RPGDYSDMAV AFRPSHADAT YQSKYGIQAR 
SGGGRASARE TIGRVAAGAI AKQLLRKAAG TEILAWVKQI HTIEAHGIDP STVSMNDIEA 
NIVRCPEASV ANQMIERIEA IGREGDSCGG VIECVVRQPA VGLGMPVFDK LEADLAKAVM 
SLPATKGFEI GSGFSGTLLK GSEHNDAFIP GDDGRLHTAT NNSGGIQGGI SNGEPIVIRV 
GFKPTATIRK EQQTIDSDGN ATTLAAKGRH DPCVLPRAVP MVEAMVALTL ADHLLRQQGQ 
CSLW