Gene PMT9312_0226 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PMT9312_0226
Symbol
ID	3765011
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9312
Kingdom	Bacteria
Replicon accession	NC_007577
Strand	+
Start bp	218769
End bp	219866
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	37%
IMG OID	637796733
Product	chorismate synthase
Protein accession	YP_396724
Protein GI	78778612
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAGTA GTTTTGGAAA AATTTTTCGG GTTAGTACTT TTGGAGAATC ACATGGCGGT 
GGAGTAGGAG TTATCCTTGA TGGATGTCCA CCTAAGTTAA AAATAGATAT AAAACTGATA 
CAAAATGAAT TAGATAGGCG TAGACCTGGT CAAAGTGACA TTACAACACC ACGAAATGAA 
GACGATAAAA TTGAGATATT AAGTGGGATA AAGGAAGGTT TAACACTTGG AACTCCAATA 
GCGATGTTGG TAAGAAACAA GGATCAAAGA CCAGGAGATT ATAATAATTT GGAGCAAGTA 
TTTAGACCAT CTCATGCAGA TGGTACATAT CATCTGAAAT ATGGAATTCA GGCTGGTTCT 
GGAGGTGGAA GAGCGTCTGC AAGAGAAACA ATTGGGCGAG TAGCAGCTGG TGCTGTAGCA 
AAACAATTAT TAAAAAACTT GTGTAACACT GAAATATTAT CTTGGGTAAA GCGTATACAT 
GATATTGATT CTGATGTAAA TAAAGAGAAG ATTTCTCTCA ATAAAATAGA TTCTAATATT 
GTCAGATGTC CTGATGAAAA GGTATCAGCA GAAATGATCG ATAGAATTAA GGATTTAAAG 
CGTCAAGGAG ACTCTTGTGG AGGTGTAATT GAATGTCTGG TAAGGAATGT TCCGTCTGGT 
CTTGGGATGC CTGTTTTTGA TAAATTGGAA GCTGATTTAG CGAAGGCTTT GATGTCTTTG 
CCAGCCACGA AAGGCTTTGA AATAGGTTCA GGTTTCTCTG GAACTTATTT AAAAGGAAGC 
GAACATAATG ATTCATTCAT TAAGTCTGAT GATATTAGTA AGTTAAGAAC AACATCTAAC 
AATTCAGGAG GTATACAGGG CGGAATAAGT AATGGAGAAA ATATTGAGAT GAAGATAGCT 
TTTAAACCCA CAGCAACCAT TGGGAAAGAA CAGAAAACCG TAAATGCTGA AGGGAAAGAA 
GTATTGATGA AAGCAAAAGG GAGACATGAT CCATGCGTTC TACCAAGAGC AGTTCCTATG 
GTTGACGCTA TGGTCGCTTT AGTACTTGCT GATCATTTGC TTCTGAATAA TGCTCAATGT 
GGATTAATGA AAAATTAG

Protein sequence

MSSSFGKIFR VSTFGESHGG GVGVILDGCP PKLKIDIKLI QNELDRRRPG QSDITTPRNE 
DDKIEILSGI KEGLTLGTPI AMLVRNKDQR PGDYNNLEQV FRPSHADGTY HLKYGIQAGS 
GGGRASARET IGRVAAGAVA KQLLKNLCNT EILSWVKRIH DIDSDVNKEK ISLNKIDSNI 
VRCPDEKVSA EMIDRIKDLK RQGDSCGGVI ECLVRNVPSG LGMPVFDKLE ADLAKALMSL 
PATKGFEIGS GFSGTYLKGS EHNDSFIKSD DISKLRTTSN NSGGIQGGIS NGENIEMKIA 
FKPTATIGKE QKTVNAEGKE VLMKAKGRHD PCVLPRAVPM VDAMVALVLA DHLLLNNAQC 
GLMKN