Gene Acid345_2393 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2393
Symbol
ID	4071391
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	2831302
End bp	2832336
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	59%
IMG OID	637984409
Product	short chain dehydrogenase
Protein accession	YP_591468
Protein GI	94969420
COG category	[R] General function prediction only
COG ID	[COG4221] Short-chain alcohol dehydrogenase of unknown specificity
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.895738
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTCCA AAACTGTTAG TTTCTCACAC GCGATAGGGG TTTGCGAACC CACCACCGCT 
GGGAAGCGCA TATCCAGTGT CGAAACGCGA CTTCGTACCC TTAAGCCGCA CCATCGAACA 
TTGTTTTGTG ATAAGGAATC CCGCTTCCCT GCAGCTCTTT GGCGTGCTTT CATCTTCACC 
ATGGAACAGA AAGTCGCTCT CATCACCGGC GCCTCCAGCG GTTTCGGCCT GCTCACCGCC 
GTTGAAATGT CTGCTGCCGG TTATCGCGTC GTCGCCACAA TGCGTAATCC GGATCGCCGC 
TCCAAGCTCG ACGAAGCATT GGCCGCCCGC AACCCATCGA CACCCATCGA TGTCCGCCAA 
CTCGACATCA CCGACTCCGC CGCGATCCCC CGAGTCATTG ACGAAGTTGT CGCTACGCAC 
GGCCGCATCG ATGTCCTCGT CAATAACGCC GGTTTCGCCC TTGCCGGGTT CCTCGAAGAC 
ATCTCCCTCG ACGAACTCCG CCGTCAATTC GATACCAATT TCTTCGGCCA CGTCGCCGTT 
ACCAAGGCCG TTCTGCCCGT CATGCGCCGC CAGCGCAGCG GCCACATCAT CATGATCGGC 
TCCATCTCCG GACGCTGCGC CCCGCCCGTC ATCGGCTCCT ATGCCTCATC TAAATGGGCA 
CTCGAAGGTT GGAGCGAAGC TCTCCGCATC GAGACCCAAG CCCTCGGCAT TCAGGTCGTC 
ATGATCGAAC CCGGCTCCTA CGACACCGAT ATCTGGACCC GCAATGCGCA GCTCGGCAGC 
TTCGCTCTCC ATCCCGATTC CCCCAACCAC GCCCGCGGCG CCCGCTTCTC CGAGCACGTA 
CAGAAGGGCA TCCACCGCGC CGATCCGCGC CAGGTCGCCC AACTAATCCT CCGCATCGCG 
CAAACCCCGC ACCCCAAGCT TCGCTACGTC ACCGGCAAAG ACGCAAAAAT GCAACTCATA 
TTGAAAAACG TCCTGCCGTG GCGCCGCTAT GAAAAACTTG CCGCGAAGTT TATGAAGATC 
GACCAGGCGG ATTAA

Protein sequence

MSSKTVSFSH AIGVCEPTTA GKRISSVETR LRTLKPHHRT LFCDKESRFP AALWRAFIFT 
MEQKVALITG ASSGFGLLTA VEMSAAGYRV VATMRNPDRR SKLDEALAAR NPSTPIDVRQ 
LDITDSAAIP RVIDEVVATH GRIDVLVNNA GFALAGFLED ISLDELRRQF DTNFFGHVAV 
TKAVLPVMRR QRSGHIIMIG SISGRCAPPV IGSYASSKWA LEGWSEALRI ETQALGIQVV 
MIEPGSYDTD IWTRNAQLGS FALHPDSPNH ARGARFSEHV QKGIHRADPR QVAQLILRIA 
QTPHPKLRYV TGKDAKMQLI LKNVLPWRRY EKLAAKFMKI DQAD