Gene Clim_1965 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1965
Symbol	glyA
ID	6355020
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	2180109
End bp	2181434
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	56%
IMG OID	642669563
Product	serine hydroxymethyltransferase
Protein accession	YP_001943976
Protein GI	189347447
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0112] Glycine/serine hydroxymethyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.128494
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGGATA CCGACATCCT GAGGATGCAG GATAAAGAGG TTTTCGAGGC GATAGCCGGC 
GAAACCCTGA GGCAGACAGA AACCCTCGAA CTCATCGCAT CCGAGAACTT CACCAGCAGG 
GCCGTCATGC AGGCCTGCGG CTCGCTCATG ACCAACAAAT ATGCCGAAGG TTATCCCGGA 
AAGCGCTATT ACGGAGGGTG CGAGTTTGTC GATATTGCTG AAAATCTTGC CCGCGATCGT 
GCAAAAAAAC TTTTCGGCTG CCAGTATGTC AACGTTCAGC CGCATTCCGG TTCGAGCGCC 
AACATGGCGG TGCTTTTTTC GGTGCTCAAG CCGGGCGACC GCATTATGGG CCTCGATCTC 
TCGCATGGAG GCCATCTTAC GCACGGCAGC CCGGTGAACT TTTCAGGGCA GCTTTTTGAT 
GCACACTCCT ACGGCGTCGA CCGTGAGACC GGCTGCATCG ACATGAACCG GGTCGAAGAA 
CTGGCGCTTG AGGTCCGTCC TAAACTCATC ATCTGCGGTG CGAGCGCCTA CTCTCAGGGG 
TTTGATTTCA AGGCATTCAG GGAGATCGCC GACAAGGTCG GTGCCCTTCT GATGGCCGAT 
ATCGCCCACC CTGCAGGTCT GATTGCCGCC GGGCTGCTCA GCGACCCCAT GCCGCACTGT 
CATTTCGTTA CCACGACTAC CCACAAGACG CTCCGCGGCC CCAGAGGGGG TATGATCATG 
ATGGGCAGCG ACTTTGAAAA TCCTCTCGGC ATTACCATCA AAACGAAAAC CGGATCGAGG 
GTGAAAATGA TGTCGGAGGT CATGGATGCC GAAGTGATGC CCGGTATTCA GGGTGGTCCG 
CTCATGCACA TCATAGCGGG AAAGGCCGTT GCCTTCGGCG AGGCGCTGCA GCCGGCATTC 
AGGGAGTATG CCGTGCAGGT CAGGAAAAAT GCAGCTGCAA TGGCCGAAAG TTTTGCCGGT 
CTCGGTTATA ATATTGTCAG CGGCGGCACC AAAAACCATC TCATGCTGCT CGATCTGCGC 
AACAAGGAGG TTAACGGCAA GGTGGCGGAA AATCTGCTGC ATGAGGCAGG CATCACGGTC 
AACAAGAATA TGGTGCCGTT TGACGATAAA TCGCCTTTCG TTACCAGCGG CATCAGGATC 
GGTACTGCGG CCATGACCAC TCGCGGGATG ACCGAAAACG ACAGCCGGAC GGTTGCCGGG 
CTGATCGACC AGGTTATTTC ATCGGCGAAT TCCGCCGGAG TAGAAGAGAT ATGCCGTACA 
GTACGGCATG ATATCAGGGA ACTCTGTTTG GCTTATCCGC TTGAAGGATA CGGCGTAAAC 
CCCTGA

Protein sequence

MMDTDILRMQ DKEVFEAIAG ETLRQTETLE LIASENFTSR AVMQACGSLM TNKYAEGYPG 
KRYYGGCEFV DIAENLARDR AKKLFGCQYV NVQPHSGSSA NMAVLFSVLK PGDRIMGLDL 
SHGGHLTHGS PVNFSGQLFD AHSYGVDRET GCIDMNRVEE LALEVRPKLI ICGASAYSQG 
FDFKAFREIA DKVGALLMAD IAHPAGLIAA GLLSDPMPHC HFVTTTTHKT LRGPRGGMIM 
MGSDFENPLG ITIKTKTGSR VKMMSEVMDA EVMPGIQGGP LMHIIAGKAV AFGEALQPAF 
REYAVQVRKN AAAMAESFAG LGYNIVSGGT KNHLMLLDLR NKEVNGKVAE NLLHEAGITV 
NKNMVPFDDK SPFVTSGIRI GTAAMTTRGM TENDSRTVAG LIDQVISSAN SAGVEEICRT 
VRHDIRELCL AYPLEGYGVN P