Gene GSU1607 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1607
Symbol	glyA
ID	2685603
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	1757872
End bp	1759119
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	58%
IMG OID	637126287
Product	serine hydroxymethyltransferase
Protein accession	NP_952658
Protein GI	39996707
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0112] Glycine/serine hydroxymethyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.203798
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGATTC TCGAAACCTT TGACCCGCAG GTAGCTGAGG CGATCCGCCA TGAAACCGAA 
CGGCAGGAGT ACAACCTGGA GTTGATCGCT TCCGAAAACT TTGTTTCCGA GGCGGTACTG 
GAAGCCCAGG GCTCGGTGAT GACCAATAAG TATGCCGAGG GATACCCCGG TAAGCGCTAC 
TATGGTGGAT GCCACCATGT GGACGTGGTG GAAAATCTCG CTATTGAGCG GGCCAAGGAG 
CTTTTCGGTG CCGATCATGC CAACGTCCAG CCCCATTCGG GCTCCCAGGC AAATATGGCG 
GTCTATTTTT CGGTGCTCAA GCCCGGCGAC ACCATTCTTG GGATGAATCT GTCCCACGGC 
GGCCACCTGA CCCACGGCAG CCCCGTGAAC TTCTCCGGCC GTTTCTTCAA CGTGGTTCCC 
TACGGCGTGT CCCAGGAGAC CGAAACGATC GACTTCAATG AGGTGGAGCG TCTTGCCCTT 
GAGCATAAGC CGAAGATGAT AGTTGTGGGG GCAAGCGCCT ATCCCCGAAC CATCGATTTT 
GCCGCCTTCC GCATCATTGC CGATAAGGTC GGCGCGGTTA TCATGGTTGA TATGGCTCAC 
ATTGCGGGCC TGGTTGCGGC CGGTCTCCAT CCGAGCCCTG TTCCCTACGC TGAATTCGTG 
ACCACCACTA CCCATAAGAC CCTCAGAGGT CCCCGCGGCG GGATGATCCT GTGCCGTGAG 
GAGTACGCCA AGACGCTCAA TTCCAACATC TTCCCCGGTA TCCAGGGGGG GCCGCTCATG 
CATGTCATCG CGGCCAAGGC CGTTGCCCTC AAGGAGGCCC TCCAGCCCGA GTTCAAAGCG 
TATCAGGCCC AGATCGTGAA AAATGCCAAG GCCCTTGCCG ACGAGCTGGT AAAGCGCGGG 
TTCCGGCTTG TGTCCGGCGG CACCGATAAC CATCTGATGC TGGTTAACCT AACCGGCACC 
GAACTGACCG GCAAGGTGGC GGAAGAGTCT CTGGATAAGG CCGGCATCAC GGTGAACAAG 
AACACGGTGC CTTTCGAGAC CCGTTCACCC TTTGTCACCT CCGGTTTCCG GATCGGCACT 
CCCGCAGCCA CTACCCACGG TCTCAAGGAA GCTGAAATGG CCGACGTGGC GGGCTTTATC 
GCAGAGGCCC TGGCCAACGT GGACAATGAT GCCAAACTCG CCGAGATTAA GGGGAGGGTC 
AATGTGCTTA TGAAACGCTT CCCCCTCTAT GCTCACCGTC TTTCATAA

Protein sequence

MSILETFDPQ VAEAIRHETE RQEYNLELIA SENFVSEAVL EAQGSVMTNK YAEGYPGKRY 
YGGCHHVDVV ENLAIERAKE LFGADHANVQ PHSGSQANMA VYFSVLKPGD TILGMNLSHG 
GHLTHGSPVN FSGRFFNVVP YGVSQETETI DFNEVERLAL EHKPKMIVVG ASAYPRTIDF 
AAFRIIADKV GAVIMVDMAH IAGLVAAGLH PSPVPYAEFV TTTTHKTLRG PRGGMILCRE 
EYAKTLNSNI FPGIQGGPLM HVIAAKAVAL KEALQPEFKA YQAQIVKNAK ALADELVKRG 
FRLVSGGTDN HLMLVNLTGT ELTGKVAEES LDKAGITVNK NTVPFETRSP FVTSGFRIGT 
PAATTHGLKE AEMADVAGFI AEALANVDND AKLAEIKGRV NVLMKRFPLY AHRLS