Gene NATL1_03361 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_03361
Symbol	glyA
ID	4779415
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	310495
End bp	311730
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	38%
IMG OID	640083602
Product	serine hydroxymethyltransferase
Protein accession	YP_001014165
Protein GI	124025049
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0112] Glycine/serine hydroxymethyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.498926
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATGTG ATCCAAGTAT TGCGAAATTA ATAAACAATG AATTATCAAG ACAAGAAACT 
CATTTAGAGC TTATCGCAAG TGAGAATTTT GCCTCTAAGG CCGTAATGGA AGCCCAAGGA 
TCAGTCCTAA CAAATAAATA TGCTGAAGGT CTCCCTAACA AACGCTATTA CGGAGGATGT 
GAGTATATCG ACGGAATTGA GCAACTAGCA ATAGATAGAG CAAAAAACCT TTTTGGGGCC 
AACTGGGCAA ACGTCCAACC TCACAGCGGA GCTCAAGCTA ACTTTGCAGT TTTCCTTAGC 
CTTCTAAAGC CGGGGGACAC AATTATGGGA ATGGACTTAT CTCATGGAGG TCACCTCACT 
CATGGTTCAC CTGTAAATGT AAGCGGCAAA TGGTTTAAAA CTTGCCATTA CGAAGTTGAT 
AAAAAGACTG AAATGCTCGA TATGGATGCA ATAAGAAAAA AAGCAATTGA AAATCAACCT 
AAATTGATTA TCTGTGGATT CTCTGCCTAT CCTCGAAAAA TTGACTTCAA AGCTTTCAGA 
TCAATAGCTG ATGAGGTAAA TGCTTATTTA TTAGCTGATA TTGCTCATAT TGCTGGTTTA 
GTAGCAAGTG GACTTCACCC AAGTCCAATC CCATATTGTG ATGTAGTTAC AACAACCACT 
CACAAAACTC TTAGAGGGCC AAGGGGTGGA CTAATCCTCT CAAAAGATGA GGAGATAGGA 
AAAAAACTTG ATAAAGCAGT ATTTCCTGGC ACCCAAGGAG GTCCTTTAGA ACATGTAATC 
GCAGCCAAGG CTGTTGCATT CCAAGAAGCT TCTGCACCCG AATTCAAGAT TTATAGCCAA 
AAAGTAATCT CAAATGCACA AGTTCTTTCT AATCAACTTC AAAAAAGAGG AATTTCAATT 
GTAAGCAAAG GAACTGACAA TCATATAGTT CTTCTTGACC TTAGAAGCAT TGGTATGACA 
GGTAAAGTTG CTGATCAATT AGTAAGTGAT ATTAAAATAA CCGCGAACAA AAACACTGTA 
CCTTTTGACC CCGAGTCCCC ATTTGTTACT AGTGGCCTAA GGCTAGGTTC AGCAGCCCTT 
ACGACTAGAG GTTTTAATGA ACAAGCCTTT GAAGATGTTG GTAATATCAT TGCAGATAGA 
CTACTTAACC CTAACGATGA AGATATAAAG GAAAATTCAA TCAATAAAGT ATCTGAACTT 
TGCAATAAGT TTCCTTTATA TAGTGAAAAC ATCTAA

Protein sequence

MKCDPSIAKL INNELSRQET HLELIASENF ASKAVMEAQG SVLTNKYAEG LPNKRYYGGC 
EYIDGIEQLA IDRAKNLFGA NWANVQPHSG AQANFAVFLS LLKPGDTIMG MDLSHGGHLT 
HGSPVNVSGK WFKTCHYEVD KKTEMLDMDA IRKKAIENQP KLIICGFSAY PRKIDFKAFR 
SIADEVNAYL LADIAHIAGL VASGLHPSPI PYCDVVTTTT HKTLRGPRGG LILSKDEEIG 
KKLDKAVFPG TQGGPLEHVI AAKAVAFQEA SAPEFKIYSQ KVISNAQVLS NQLQKRGISI 
VSKGTDNHIV LLDLRSIGMT GKVADQLVSD IKITANKNTV PFDPESPFVT SGLRLGSAAL 
TTRGFNEQAF EDVGNIIADR LLNPNDEDIK ENSINKVSEL CNKFPLYSEN I