Gene Acid345_3654 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3654
Symbol
ID	4072257
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4323445
End bp	4324440
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	60%
IMG OID	637985677
Product	aldo/keto reductase
Protein accession	YP_592729
Protein GI	94970681
COG category	[R] General function prediction only
COG ID	[COG1453] Predicted oxidoreductases of the aldo/keto reductase family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.488784
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGACT CCACTGCTGC GATCCCTCAA CGCAAATTCG GCAAAGCCGA CGCCACGGTT 
TCCTGCGTCG GCTTCGGTGG TCACCACGTT GGCGACGCCA CCGACGTGAA AGAAGCCGTC 
AAGCTGATCC ATCAGGCCGT AGATGCCGGC ATCACCTTCT TCGACAACTG CTGGGAATAC 
CATCGTGGTA AGACCGAAGA CTGGATGGGC CAAGGCCTCA AGGGTCGTCG CGAAAAGGTC 
TTCCTGATGT CCAAGGTCTG CACCCACGGG CGCGATGCCG ACCTCGCCAT GCGCATGCTC 
GAGCAGTCGC TCAACCGCCT CCAGACCGAT CATCTCGACC TCTGGCAGAT TCATGGCGTC 
TCATTCGACA ACGATCCCGA GCTCTTCATT CGCCCGAACG GCGCGGCCGA GGCCCTCCGC 
AAAGCCAAAG AACAGGGCAA AGTCCGCTTC GTAGGATTCA CCGGTCACAA GGATCCCGAC 
ATCCATCTCG CGATGCTGAA TACCGGCTTT CCCTTCGACG CCGTGCAGAT GCCGCTGAAC 
CCGTTCGACT ACCACTTCCG CAGCTTTCAG GGAAAAGTGC TGCCCGAGTT GCAGAAGCGC 
GGGATCGCGG CACTTGGCAT GAAGCCCATC AGCGGCCATG GCGACGCGGT AAAGCGCGGT 
GTGCTGAGTG GAGAAGAATC GCTGCGTTAC GCGATGAGCC TGCCCGGCGT GACCACGACC 
ATCACCGGCA TCGACAAACA GGAAGCGCTC GACCAGGCGA TCAAAGTCGC GCGCGGCTTC 
CAACCCATGA CCGAGCAGGA AATGTCCGCC CTTCGCGATC GCGTGAAGCC CTACGCCGGC 
GATGGACGCT ACGAACTCTA CAAAGTCTCG CTCAAGTTCG ATAATCCCGA GGCGCGCATG 
GCACACGATT TCCCCCTCGA CATGCAGTCC GTCGAGGTGA AGGAAATGAT GAAGGCCACC 
GAAAATACCG GCAAGCCGTT TCCGGAGGCG AAATGA

Protein sequence

MADSTAAIPQ RKFGKADATV SCVGFGGHHV GDATDVKEAV KLIHQAVDAG ITFFDNCWEY 
HRGKTEDWMG QGLKGRREKV FLMSKVCTHG RDADLAMRML EQSLNRLQTD HLDLWQIHGV 
SFDNDPELFI RPNGAAEALR KAKEQGKVRF VGFTGHKDPD IHLAMLNTGF PFDAVQMPLN 
PFDYHFRSFQ GKVLPELQKR GIAALGMKPI SGHGDAVKRG VLSGEESLRY AMSLPGVTTT 
ITGIDKQEAL DQAIKVARGF QPMTEQEMSA LRDRVKPYAG DGRYELYKVS LKFDNPEARM 
AHDFPLDMQS VEVKEMMKAT ENTGKPFPEA K