Gene Acid345_3662 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3662
Symbol
ID	4072265
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	4333444
End bp	4334724
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	61%
IMG OID	637985685
Product	S-adenosyl-L-homocysteine hydrolase
Protein accession	YP_592737
Protein GI	94970689
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0499] S-adenosylhomocysteine hydrolase
TIGRFAM ID	[TIGR00936] adenosylhomocysteinase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.253183
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTACGA CATCTACTTC GAACGTCGCG TGCGACATCG CGAACATTGA ACTGGCGGAC 
CTGGGCAAAA AGCGCATCGA ATGGGCGAAC CAGTCGATGA AAGTGCTGCA GATCATCCGC 
AAGGATTTCA TCAAGAACCA GCCGCTGAAG GGCTTCCGCA TCAGCGCCTG CCTGCACGTG 
ACGGCCGAGA CCGCCAACCT GATGATCACG CTGCGCGACG GTGGCGCCGA GGCTGTTCTG 
TGCGCCTCGA ACCCGCTCTC GACACAGGAT GACGTGGCTG CCTCACTCGT CCGCGACTAC 
GGTATTCCCG TCTACGCGAT CAAGGGCGAG GACAACGATA CCTACTACTC GCACATCATG 
GCGGCGCTCG ACCACAAGCC GCACATCACG ATGGATGACG GCGCCGACCT CGTGACGATC 
GCCCTGACCA AGCGCAAGGA CGCGCTGGAG CACGTGATCG CAGGCACCGA AGAGACGACC 
ACCGGCGTCA TCCGCCTGCG CGCGATGGCG AAGGACGGCA TGTTGAAGTA CCCGATCATC 
GCGGTGAATG ATGCCGACAC CAAGCACATG TTCGACAACC GCTACGGCAC CGGTCAGTCC 
ACGATTGACG GTATCGTGCG CGCGACGAAC TTCCTGCTCG CAGGCGCGAA GTTCGTGGTC 
GCTGGCTACG GCTGGTGCGG ACGCGGTTTG GCTTCGCGTG CGCGCGGCCT TGGAGCCGAG 
GTCATCGTGA CCGAAATCGA TCCCACGAAG GCGATCGAAG CCGTGATGGA CGGCTACCGC 
GTGATGTCAA TGCACGAAGC GGCACAGCTT GGCGATGTGT TCTGCACCGT GACCGGCAAT 
AAGAGCGTTC TGCGCAAGGA ACACTTCGAG TTGATGAAGG ACGGCGCGAT CATTTCGAAC 
TCCGGCCACT TCAACGTCGA GATCGACATT CCGGCGCTGG AAAAGCTGTC GTCGTCGAAG 
CGCACGACCC GCACGTTTGT GGATGAGTAC TCGCTGAAAG ATGGCCGCAA GATCAACCTG 
CTGGGCGAAG GCCGCCTGAT CAACCTGGCC AGCGCGGAAG GCCATCCGCC GTCCGTGATG 
GACATGAGCT TCGCCGACCA GGCGCTCTCG CTCGACTACC TGGTGAAACA CCACAAGACG 
CTCGAGAAGA GCGTGTTCAA GGTTCCGGAA GAACTCGACA AGCGGGTTGC GAAGCTGAAG 
CTGGAGTCGA TGGGCGTGAA GATCGACAAG CTGACGCCGG AGCAAGAAGA GTACCTGGCG 
GGCTGGAGCG AAGGAACATA G

Protein sequence

MATTSTSNVA CDIANIELAD LGKKRIEWAN QSMKVLQIIR KDFIKNQPLK GFRISACLHV 
TAETANLMIT LRDGGAEAVL CASNPLSTQD DVAASLVRDY GIPVYAIKGE DNDTYYSHIM 
AALDHKPHIT MDDGADLVTI ALTKRKDALE HVIAGTEETT TGVIRLRAMA KDGMLKYPII 
AVNDADTKHM FDNRYGTGQS TIDGIVRATN FLLAGAKFVV AGYGWCGRGL ASRARGLGAE 
VIVTEIDPTK AIEAVMDGYR VMSMHEAAQL GDVFCTVTGN KSVLRKEHFE LMKDGAIISN 
SGHFNVEIDI PALEKLSSSK RTTRTFVDEY SLKDGRKINL LGEGRLINLA SAEGHPPSVM 
DMSFADQALS LDYLVKHHKT LEKSVFKVPE ELDKRVAKLK LESMGVKIDK LTPEQEEYLA 
GWSEGT