Gene A9601_02801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_02801
Symbol	glyA
ID	4716965
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	257996
End bp	259267
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	36%
IMG OID	640077980
Product	serine hydroxymethyltransferase
Protein accession	YP_001008675
Protein GI	123967817
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0112] Glycine/serine hydroxymethyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.632622
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATATCC TTCAAAATCT TAAAGAAAGT GATCCAGTAA TATCAAATTT TATCAACTCT 
GAAAAAAATA GGCAGGAAAC TCATCTTGAG TTAATCGCAA GCGAAAATTT CGCATCAATT 
GCTGTTATGC AGGCTCAAGG TTCAGTCCTT ACAAATAAAT ACGCCGAGGG GTTACCTCAA 
AAAAGATATT ACGGGGGATG TGAATTTGTT GATGAAATCG AAGAATTAGC TATTCAGAGA 
GCGAAAAAAT TATTTAATGC AAATTGGGCT AATGTTCAAC CCCATAGTGG AGCACAGGCA 
AATGCTGCTG TTTTCCTAAG TCTACTTAAA CCTGGCGACA CAATCATGGG GATGGATTTA 
TCTCATGGTG GACACTTAAC ACATGGGTCT CCAGTAAATA TGAGTGGTAA GTGGTTCAAT 
GCAGTTCACT ATGGTGTAAA TAAAGAAACT AGTGAATTAA ATTTTGATGA AATAAGAGAG 
ATAGCACTTG AAAAAAAACC AAAATTGATC ATATGCGGAT ATTCTGCTTA TCCAAGAACA 
ATCGATTTTG AATCGTTTAG AAATATTGCA GATGAAGTTG GGGCTTTTTT AATGGCTGAT 
ATTGCACATA TTGCCGGTCT TGTAGCAAGT AAACTTCATC CAAATCCAAT ACCTCATTGT 
GATGTAGTAA CTACAACTAC TCATAAAACA TTAAGAGGGC CTAGAGGGGG ACTTATCTTA 
TGTAAAGATG CAGAATTTGG AAAGAAATTT GATAAATCTG TTTTTCCTGG CACTCAGGGC 
GGGCCCCTCG AACATATAAT AGCCGCTAAA GCAGTCGCAT TTAGAGAAGC CTTACAGCCA 
GATTTCGTTA ATTATTCCCA ACAAGTAATA AAAAATGCAA AAGTTCTAGC TTCAACTTTA 
ATAAATAGAG GTATCAATAT CGTTAGTGGA GGCACTGATA ATCATATTGT TTTACTCGAT 
TTAAGGAGTA TCAATATGAC TGGTAAAATT GCTGACTTGC TTGTAAGTGA AGTTAATATC 
ACTGCAAATA AAAATACTGT TCCATTTGAT CCTGAATCAC CTTTTGTAAC CAGCGGACTA 
AGGTTAGGAA CTGCTGCTTT AACTACTAGA GGCTTTAATG AGAATGCTTT TGCTGAAGTT 
GGCGAAATTA TTGCTGATAG ATTACTTAAC CCAGACAATT CACTGATTGA AAGTCAATGT 
AAAGAAAGAG TATTAACCTT ATGTAATCGT TTTCCTCTTT ATGAAGGCAA ACTTGAAGCA 
TCAATTAAAT GA

Protein sequence

MNILQNLKES DPVISNFINS EKNRQETHLE LIASENFASI AVMQAQGSVL TNKYAEGLPQ 
KRYYGGCEFV DEIEELAIQR AKKLFNANWA NVQPHSGAQA NAAVFLSLLK PGDTIMGMDL 
SHGGHLTHGS PVNMSGKWFN AVHYGVNKET SELNFDEIRE IALEKKPKLI ICGYSAYPRT 
IDFESFRNIA DEVGAFLMAD IAHIAGLVAS KLHPNPIPHC DVVTTTTHKT LRGPRGGLIL 
CKDAEFGKKF DKSVFPGTQG GPLEHIIAAK AVAFREALQP DFVNYSQQVI KNAKVLASTL 
INRGINIVSG GTDNHIVLLD LRSINMTGKI ADLLVSEVNI TANKNTVPFD PESPFVTSGL 
RLGTAALTTR GFNENAFAEV GEIIADRLLN PDNSLIESQC KERVLTLCNR FPLYEGKLEA 
SIK