Gene Syncc9605_0304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Syncc9605_0304
Symbol
ID	3737538
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus sp. CC9605
Kingdom	Bacteria
Replicon accession	NC_007516
Strand	-
Start bp	307347
End bp	308447
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	61%
IMG OID	637774888
Product	chorismate synthase
Protein accession	YP_380635
Protein GI	78211856
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.21806
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCATGG GCAGCAGCTT CGGCGACCTC TTCCGGATCA GCACCTTCGG TGAATCCCAC 
GGGGGAGGGG TGGGTGTGAT TGTTGAGGGC TGTCCACCAC GGCTCAACCT CAGCGTCGAA 
TCGATTCAGG CCGAACTGGA TCGACGCAAG CCAGGCCAGA GTCACATCAC CACACCGCGC 
AAGGAAGCGG ACCAGGTGCA AGTTCTCAGT GGCCTGCTGG ATGGCGAGAC CACGCTTGGC 
ACCCCAATCG CCATGGTCGT GCGGAACAAG GACCAACGGC CGGGGGATTA CAAGGACATG 
GCGGTCGCCT TCCGCCCATC CCATGCCGAT GCCACATACC AGGCGAAATA TGGAATCCAG 
GCCCGCAGCG GTGGGGGCCG TGCATCGGCG CGGGAAACCA TCGGCCGTGT CGCTGCAGGT 
GCAATCGCCA AGCAGCTGCT GAAACAAGCG GCAGGAACTG AAATCCTGGC CTGGGTGAAG 
CGGATCCACA ACATCGAAGC CTCCGGCATC GACCCGCAAC GGGTTCAGCT CAGTGATGTA 
GAAGCCAACA TCGTGCGATG TCCCGAATCG GCAGTAGCCG AGCGGATGGT TGAGCGCATC 
GAAGCCATCG GCCGCGAAGG TGATTCCTGC GGCGGGGTGA TCGAATGCGT GGTGCGCCAT 
CCCGCCGTTG GTTTAGGCAT GCCGGTGTTC GACAAACTCG AAGCCGACCT CGCCAAAGCT 
GTGATGTCGT TACCGGCCAC CAAGGGTTTT GAAATTGGAT CCGGTTTCGA TGGAACGCTG 
TTGAAAGGCA GCGAGCACAA CGATGCTTTT CTGCCGAGCG ACGACGGTCG GCTGAAGACC 
GCCACCAACA ACTCCGGCGG CATCCAGGGG GGCATCAGCA ATGGTGAGCC GATTGTGATC 
CGGGTAGCCT TCAAGCCAAC GGCCACGATC CGCAAAGAGC AGCAGACCAT CGATTCCGAT 
GGCAAGGCCA CCACACTCGC AGGGAAAGGA CGGCATGACC CCTGCGTTCT GCCACGGGCT 
GTACCGATGG TGGAGGCGAT GGTGGCACTC GTTCTGGCTG ATCACCTGCT GAGGCAACAG 
GGGCAATGCA GCCTTTGGTG A

Protein sequence

MAMGSSFGDL FRISTFGESH GGGVGVIVEG CPPRLNLSVE SIQAELDRRK PGQSHITTPR 
KEADQVQVLS GLLDGETTLG TPIAMVVRNK DQRPGDYKDM AVAFRPSHAD ATYQAKYGIQ 
ARSGGGRASA RETIGRVAAG AIAKQLLKQA AGTEILAWVK RIHNIEASGI DPQRVQLSDV 
EANIVRCPES AVAERMVERI EAIGREGDSC GGVIECVVRH PAVGLGMPVF DKLEADLAKA 
VMSLPATKGF EIGSGFDGTL LKGSEHNDAF LPSDDGRLKT ATNNSGGIQG GISNGEPIVI 
RVAFKPTATI RKEQQTIDSD GKATTLAGKG RHDPCVLPRA VPMVEAMVAL VLADHLLRQQ 
GQCSLW