Gene Acid345_2500 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2500
Symbol
ID	4069869
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2956656
End bp	2957603
Gene Length	948 bp
Protein Length	315 aa
Translation table	11
GC content	60%
IMG OID	637984517
Product	cystathionine beta-synthase (acetylserine-dependent)
Protein accession	YP_591575
Protein GI	94969527
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0031] Cysteine synthase
TIGRFAM ID	[TIGR01136] cysteine synthases [TIGR01139] cysteine synthase A

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATACAT CTGAGATGTC CACTCTCCGC GTCGCCGAAG ATATTTCTGA ACTCGTTGGC 
CAGACCCCGA TGCTTCACCT GCGCAAGATG GTGCCGCCGG AGATCGCCGA CATCTACGTA 
AAACTCGAGT TTCTTAACCC GGGCGGAAGC ATTAAAGACC GCGCTGCCCT GGGCATGATC 
CTGCGCGCGG AAAAGGAAGG CGTGCTCAAG CCGGGCGCGA CGATTCTCGA GGCGACAGCG 
GGTAACACCG GCGTCGGCTT GGCGCTGATC GGCGTAAGCC GCGGATACAA GGTCGTCCTC 
GCCGTCCCGC AGAAATTCAG CAAAGAGAAA GTCATGCTGA TGGAGGCTCT TGGTGCTCAG 
GTGTATCGGA CGCCGGACGC CGAAGGCATG GAAGGCGCAA TCCGGCTCGT CAAGAAATTC 
CTGACCGAGA TTCCGAACTC GTGGCTAGCA GGGCAGTTCG AGAACCAGGC GAATCCTGAT 
TTCCACTATG AGACGACCGG ACGCGAGTTA TGGGAACAGA TGGGCGGCAA GATTGATGCC 
ATCGCACTCG GTGCAGGCAC GGCAGGGACG TTCACGGGAG TGGCGCGCTA CTTGAAGGAG 
CGGTCGCCGC AGACGCTGTG CGTGCTGGTG GAGTCGCAGG CGTCGGTGTA CGGCGGCGGC 
AAGAGCGGGC CGCACGCCGT AGAAGGTATC GGCGCGAGCT TCATTCCCGC AACCTTCGAT 
CGCAGCGTTT GCGATGAAGT GATCGCCGTG AAAGACGTGG ATGCGTTCCG GACAATCAAA 
GATCTGGCGG CCAAAGAAGG CGTACTGGCG GGGTCGAGCT CGGGAGCGGC AGTGTTTGCG 
AGTTTAGAGT TGGCAAAACG CCTGGGGCCG GGGAAGCGGG TCGTCACGAT TATTCCGGAC 
TCGGCTGAGC GGTACCTGTC TAAGGATCCG TATCACTTCA ACGAATAA

Protein sequence

MNTSEMSTLR VAEDISELVG QTPMLHLRKM VPPEIADIYV KLEFLNPGGS IKDRAALGMI 
LRAEKEGVLK PGATILEATA GNTGVGLALI GVSRGYKVVL AVPQKFSKEK VMLMEALGAQ 
VYRTPDAEGM EGAIRLVKKF LTEIPNSWLA GQFENQANPD FHYETTGREL WEQMGGKIDA 
IALGAGTAGT FTGVARYLKE RSPQTLCVLV ESQASVYGGG KSGPHAVEGI GASFIPATFD 
RSVCDEVIAV KDVDAFRTIK DLAAKEGVLA GSSSGAAVFA SLELAKRLGP GKRVVTIIPD 
SAERYLSKDP YHFNE