Gene Gdia_3354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_3354
Symbol	glyA
ID	6976797
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	3672797
End bp	3674095
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	69%
IMG OID	643392868
Product	serine hydroxymethyltransferase
Protein accession	YP_002277696
Protein GI	209545467
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0112] Glycine/serine hydroxymethyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0554425
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.88347
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGACC AGATGAGCCA GAGCGGGTTG CACGCCTATT TCCGCTCCCC GCTTGCCGAA 
CGCGATCCCC TGGTCGCGGA GATCATCGCG GGTGAACTGG AGCGCCAGCG CGACGGAATC 
GAACTGATCG CCAGCGAGAA CATGGTGTCC GAGGCGGTGC TGCAGGCGCA GGGCAGCGTG 
CTGACGAACA AATACGCCGA GGGTTATCCC GGCCGCCGCT ATTACGGCGG CTGCGCCGAG 
GTGGACAAGG TCGAGAGCCT GGCCATCGAG CGGGTGAAGA CGCTGTTCGG CGCGGGCTTC 
GCGAACGTGC AGCCCCATTC CGGCGCCAAC GCGAACCAGG CGGCGTTCAT GGCGCTGGTC 
AGCCCGGGCG ATACCATCCT GGGCATGAGC CTGGCGGCGG GCGGCCACCT GACGCACGGG 
GCGGCGCCGA ACTATTCCGG CAAATGGTTC CGCGCGGTGC AGTACGGCGT GCGGCGCGAG 
GACGGGCTGC TGGATTACGA GGAGATGGAG CGCCTGGCCC GGGCCGAGAA GCCGAAGCTG 
ATCGTGGCGG GGGGCTCGGC CTATCCGCGC GCGATCGATT TCGCCCGCTT CCGCGCCATC 
GCGGACGAAG TCGGGGCCTA CCTGATGGTC GACATGGCCC ATTATGCCGG ACTGGTCGCG 
GCGGGCCTGT ATCCCTCGCC GATGGCGCAT GCGCATGTGG TGACCAGCAC GACGCACAAG 
ACCCTGCGCG GCCCGCGCGG CGGCCTGATC CTGACGAATG ACGCGGACCT GGCGAAGAAG 
ATCAACTCGG CGGTCTTCCC CGGGCTGCAG GGCGGCCCGC TGATGCACGT GATCGCGGCC 
AAGGCCGTGG CGTTCGGCGA GGCGCTGCAG CCGGAATTCC GCGCCTATCA GGAAGCGGTG 
GCGGCGAATG CCCGCGTGCT GGCGGAAACG CTGCTGTCGC GCGGGTTCGA CATCGTGACG 
GGGGGCACGG ACAGCCACCT GCTGCTGGTG GACCTGCGCC CCAAGAAGGT CACGGGCCGC 
GCCGCCGAAC GCAGCCTGGA ACGCGCCGGG ATCACCGCGA ACAAGAACGC GGTGCCGTTC 
GACCCGGAAA AGCCGGCGAT CACGTCGGGG ATTCGCCTGG GCAGCCCCGC CGCCACGGCG 
CGCGGCTTCG GCACCGACGA ATTCCGCGCG GTGGGCGAGA TGATCGACGA GGTCCTGACC 
GCCATGGCCG GCAAGGGCGA GGACGGATGC CCCGCCACCG AACAGGCGGT GCACGACAAG 
GTCCGCGCCC TGTGCGCGCG CTTCCCGATC TATCGCTAG

Protein sequence

MPDQMSQSGL HAYFRSPLAE RDPLVAEIIA GELERQRDGI ELIASENMVS EAVLQAQGSV 
LTNKYAEGYP GRRYYGGCAE VDKVESLAIE RVKTLFGAGF ANVQPHSGAN ANQAAFMALV 
SPGDTILGMS LAAGGHLTHG AAPNYSGKWF RAVQYGVRRE DGLLDYEEME RLARAEKPKL 
IVAGGSAYPR AIDFARFRAI ADEVGAYLMV DMAHYAGLVA AGLYPSPMAH AHVVTSTTHK 
TLRGPRGGLI LTNDADLAKK INSAVFPGLQ GGPLMHVIAA KAVAFGEALQ PEFRAYQEAV 
AANARVLAET LLSRGFDIVT GGTDSHLLLV DLRPKKVTGR AAERSLERAG ITANKNAVPF 
DPEKPAITSG IRLGSPAATA RGFGTDEFRA VGEMIDEVLT AMAGKGEDGC PATEQAVHDK 
VRALCARFPI YR