Gene Acid345_2458 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2458
Symbol
ID	4072082
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2905426
End bp	2906943
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	62%
IMG OID	637984475
Product	glycine dehydrogenase subunit 2
Protein accession	YP_591533
Protein GI	94969485
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1003] Glycine cleavage system protein P (pyridoxal-binding), C-terminal domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCAACC TCAACGACAA AATCACCAAG GTCGCCACGC ACGTCAGCCA GAACGAAGAC 
CTCATCTTCG AAAAGTCCTC GCCCGGCAAA AAGGCCTACC GCCTTCCGCC GCTCGACGTC 
CCTGACGTTG ACGAGCGCGC CCTCCTCGGC GCCGAGTACG TCCGCGAAGA CCTCGGCAAC 
ATGCCTGAAG TTTCGGAGAT CGAAATCATC CGCCACTTCA CCCGCATGAG CACCTGGAAC 
TACGCCGTCG ATTACGGCAT GTATCCGCTT GGCTCCTGCA CCATGAAGTA CAACGCCCGC 
ATCAACGAAG TCGTCGCCCG TCTCGACGGC ATCGCCGGCG CGCACCCTTA CCAGCCCGAG 
AAACTCTCGC AAGGCAATCT GCGCATCATG AAGATGCTCG CCGACCAACT CGTCGAGATC 
ACCGGCATGG ACTCCATCAC CTTGCAGCCC GCCGCCGGCG CGCATGGCGA GATGACCGGC 
ATCCTCCTCA TCCGCGCCTA TCTCGAGTCA CAAGGGAACC CGCGCAAAAA GATCCTCATC 
CCCGACAGCG CGCACGGCAC CAATCCCGCC ACCGCGGCCA TTTGCGGCTA CCAGGTCGAG 
AACCTCAAGT CGAACTCCGC CGGACTCACC GACATTCCTT CGCTCGTCGC GCAGATGAAC 
GAAGACGTCG CCGCGCTCAT GCTCACCAAC CCGAACACCC TCGGTGTCTT CGAGCAGGAG 
ATCCACAAGA TCGCCGACAT CCTGCACGAA AAAGGCGGCC AGCTTTACAT GGACGGCGCC 
AACATGAACG CGCTCGTCGG CAAGACCCGC CCCGGCGACT TCGGTGTCGA CGTCATGCAC 
CTCAACCTGC ACAAGACGTT CTCCACCCCG CACGGCGGCG GCGGTCCCGG CTCAGGGCCA 
GTGGCCATCA AGAAGCACCT CGAGCCCTTC CTGCCCAAGC CGGTTGTCGT TGCCAATTCC 
GACGGCACTC TGCGCCTCGA CTACGACCGC CCCAAATCCA TTGGCCGCGT GCGCATGTAT 
TTCGGAAACT TCGGCATGCA CGTCCGCGCC CTCGCCTACA TCATGGCCAA CGGTCCTGAC 
GGCCTGCGCC TCACCACCGA AGACGCCGTC CTCAACGCCA ACTACATTCG CAAAAAGCTC 
GCCGGCATTT ACGATCTCCC GTACTCCACG CCAAGCATGC ACGAGGTCGT CTTCAGCGAC 
CGCAATCAGG CGCGGAAGGG AATCAAAACC GGCGACATCG CCAAGCGCTT GATCGATTAC 
GGCTTTCACC CCTACACCAC GTCGTTCCCG CTGATCGTTC CCGGCGCGCT CATGATCGAG 
CCCACCGAAA GCGAATCGAA GGAAGAGTTG GACCAGTTCA TCGAGGCAAT GAAGGCCGTA 
GCGGAAGAAG CGGAAAACAA CCCGGAGATC ATCGCGGGCG CCCCGTACAA CACGCGCGTA 
AGCCGCATGG ACGAAACCGC CGCCGCCAGA AAACCGATCC TGCGCTGGAA GCCCAAAGCC 
AAAAGCGCCG CCGAATAG

Protein sequence

MSNLNDKITK VATHVSQNED LIFEKSSPGK KAYRLPPLDV PDVDERALLG AEYVREDLGN 
MPEVSEIEII RHFTRMSTWN YAVDYGMYPL GSCTMKYNAR INEVVARLDG IAGAHPYQPE 
KLSQGNLRIM KMLADQLVEI TGMDSITLQP AAGAHGEMTG ILLIRAYLES QGNPRKKILI 
PDSAHGTNPA TAAICGYQVE NLKSNSAGLT DIPSLVAQMN EDVAALMLTN PNTLGVFEQE 
IHKIADILHE KGGQLYMDGA NMNALVGKTR PGDFGVDVMH LNLHKTFSTP HGGGGPGSGP 
VAIKKHLEPF LPKPVVVANS DGTLRLDYDR PKSIGRVRMY FGNFGMHVRA LAYIMANGPD 
GLRLTTEDAV LNANYIRKKL AGIYDLPYST PSMHEVVFSD RNQARKGIKT GDIAKRLIDY 
GFHPYTTSFP LIVPGALMIE PTESESKEEL DQFIEAMKAV AEEAENNPEI IAGAPYNTRV 
SRMDETAAAR KPILRWKPKA KSAAE