Gene Acid345_4044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4044
Symbol
ID	4072466
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	4778435
End bp	4779469
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	60%
IMG OID	637986075
Product	aldo/keto reductase
Protein accession	YP_593118
Protein GI	94971070
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATATC GACTGCTCGG CGGTTCTGGA CTCAAGGTGC CGGTGCTCAG CTTCGGCGCA 
GCGACATTTG GCGGTAAGGG CGAATTCTTC GGCGCGTGGG GTAAAACCGA CGTAGCCCAA 
GCCTCTCGCA TGGTGGACAT GTGCGTGGCA GCGGGCGTCA ACTTCTTCGA TACCGCCGAC 
ATTTATTCAC AAGGCGCCTC CGAAGAAATT CTTGGTGAAG CGATCAAGGG CAAACGCTCG 
AACCTCCTGA TCTCGACAAA AGCCACATTC CCCATGGGCG AGGGACCAAA CGATCTCGGC 
TCCTCTCGTT ATCACCTGAT CCAGGCGTGC GAAGCCAGCC TGCGGCGCCT ACAAACGGAT 
TACATCGACG TCTATCACCT CCACGGCTTC GACTATTCCA CGCCGATCGA AGAAACGCTG 
CGCACCCTCG ACACGCTCGT GACCAGCGGC AAAGTGCGTT ACATCGCGTG CTCGAATTTC 
TCTGGCTGGC ACCTGATGAA GTCGCTGGCG ATCTCCGAGA AATACGGCTG GTCGCGCTAC 
GTCGCGCACC AGGTGTACTA CTCGCTCATC GGCCGCGACT ACGAGTGGGA ATTGATGCCG 
CTCGGAATCG ACCAGAAAGT CGGCGCCATC GTATGGAGCC CGCTGGGCTG GGGCCGCCTC 
ACCGGTAAAA TCCGCCGCGG CAAACCGTTG CCGGAGGTGA GCCGCTTGCA CAAAGCCGCT 
GACGGCGGGC CGATCGTCGC CGACGAATAC CTCTATAACG TGGTGGACGC GCTGGACGAA 
GTGGCGAAAG AGGTCGGCAA AACCATCCCG CAGGTGGCGT TGAACTGGCT TCTCCAGCGC 
CCAACCGTGG CAAATGTGAT CATCGGCGCG CGCAACGAGG AGCAGTTGGC GCAAAACCTG 
GGCGCGGTGG GGTGGAATTT ATCCACCGAG CAGGTGCGGC GGCTGGATGC CGCCAGCGAT 
GTGACTCCGA TCTATCCCTA TTGGCATCAA CGGCAATTCG TCTCACGCAA TCCTCTGGCG 
CAGATTTCTG CATAA

Protein sequence

MEYRLLGGSG LKVPVLSFGA ATFGGKGEFF GAWGKTDVAQ ASRMVDMCVA AGVNFFDTAD 
IYSQGASEEI LGEAIKGKRS NLLISTKATF PMGEGPNDLG SSRYHLIQAC EASLRRLQTD 
YIDVYHLHGF DYSTPIEETL RTLDTLVTSG KVRYIACSNF SGWHLMKSLA ISEKYGWSRY 
VAHQVYYSLI GRDYEWELMP LGIDQKVGAI VWSPLGWGRL TGKIRRGKPL PEVSRLHKAA 
DGGPIVADEY LYNVVDALDE VAKEVGKTIP QVALNWLLQR PTVANVIIGA RNEEQLAQNL 
GAVGWNLSTE QVRRLDAASD VTPIYPYWHQ RQFVSRNPLA QISA