Gene WD1035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	WD1035
Symbol	glyA
ID	2738754
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Wolbachia endosymbiont of Drosophila melanogaster
Kingdom	Bacteria
Replicon accession	NC_002978
Strand	+
Start bp	995981
End bp	997258
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	40%
IMG OID	637173190
Product	serine hydroxymethyltransferase
Protein accession	NP_966759
Protein GI	42520844
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0112] Glycine/serine hydroxymethyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGAGTG TTTTAAAAAA AATCTGTGGC TCTAAAAATA GTTTAAAGTC TTTTGATAAC 
GAGGTTTATC AGTCTATAGA AAAAGAATTA CAACGCCAAA AATCACAATT GCAATTAATT 
GCATCAGAAA ATTTTGCAAG CAAAGCGGTA ATGGAGGCAC AAGGCTCTTT TCTGACTAAT 
AAATACGCAG AAGGTTATCC AGGTAAAAGA TATTACTGTG GTTGTGAGCA TGTGGACAAA 
ATTGAAAGTC TGGCTATAGA AAGACTTTGT AAGTTGTTTG GTGTTAAATT TGCAAACGTT 
CAACCTCATT CTGGTTCTCA GGCAAACCAG GCGGTATTTG CTTCACTGCT TACTCCAGGC 
GATACAATAC TTGGATTATC ACTGAGTTGC GGTGGGCATC TAACTCATGG TGCGGCACCA 
AGCCTTTCTG GTAAATGGTT TAAGTCAATT CAATATACAG TGAATAAAGA CACTTATCTG 
CTCAATATGG ATGAGATAGA AAAGCTGGCG CTGGAGCATA AACCGAAATT GATCATAGCT 
GGTGCTTCTG CTTATCCAAG AAAAATGGAC TTCAAACGCT TTCGCGAGAT TGCAGATAAA 
GTTGGTGCTT ATTTGCTTGC AGACATTGCT CACTATGCAG GGCTTATTGC AGCGGGCGAA 
TATCCATCCC CTGCTGAATA TGCACATGTT ATGACTTCCA CGACTCACAA AACTTTGCGT 
GGTCCTCGTG GTGGAATAGT GATGACCAAT GATGAAGCAT TACACAAAAA AATTCAATCC 
GCAGTTTTTC CAGGATTGCA GGGCGGGCCA CTTATGCATG TGATAGCTGC AAAAGCTGTT 
GCATTTAAAG AAGCATTAGC ACCAGAGTTT AAGACTTATA GCAAGAAAGT CGTGGAAAAT 
GCGAAAGTGC TGGCTCAAGA ATTGCAAAAG CATGGACTTG ACATTATAAC CGGTGGCACT 
GACTCTCATA TAGTGCTAGT TGACTTAAGA TCGCAGAAAT TAACTGGAAA AGACGTTGTA 
GATAGCCTTG AGAGAGCCGG TATTACCTGT AATAAAAACT CTGTACCATT TGATACAGCA 
AAGCCGACCA TCACTTCAGG GCTCCGTTTT GGCACCGCTG CTGAGACAAC ACGCGGACTT 
GAGGCAGAAA ATTTTAAAGA GATAGCTGGT CTAATAAATG AAGTAATTCA AGGATTAATC 
AGCGGAAATA GCTCAAGTGT CGAAAAAGCA GTAAAAGCTA AAGTTGAAAG GATTTGTAGT 
AATTTTCCTA TTTATTAA

Protein sequence

MMSVLKKICG SKNSLKSFDN EVYQSIEKEL QRQKSQLQLI ASENFASKAV MEAQGSFLTN 
KYAEGYPGKR YYCGCEHVDK IESLAIERLC KLFGVKFANV QPHSGSQANQ AVFASLLTPG 
DTILGLSLSC GGHLTHGAAP SLSGKWFKSI QYTVNKDTYL LNMDEIEKLA LEHKPKLIIA 
GASAYPRKMD FKRFREIADK VGAYLLADIA HYAGLIAAGE YPSPAEYAHV MTSTTHKTLR 
GPRGGIVMTN DEALHKKIQS AVFPGLQGGP LMHVIAAKAV AFKEALAPEF KTYSKKVVEN 
AKVLAQELQK HGLDIITGGT DSHIVLVDLR SQKLTGKDVV DSLERAGITC NKNSVPFDTA 
KPTITSGLRF GTAAETTRGL EAENFKEIAG LINEVIQGLI SGNSSSVEKA VKAKVERICS 
NFPIY