Gene Acid345_1785 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1785
Symbol
ID	4072845
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	2164291
End bp	2165301
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	62%
IMG OID	637983793
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_590860
Protein GI	94968812
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.250908
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGTCC TCATCATCGG CGGCACTCGC AACCTCGGGC CCTCCATCAT CTCTGCCCTC 
GTCACCGCGG GCCACCAGGT CACCATCTTC CATCGCGGCC GAACTCTTTA CGACCTCCCT 
CGCGAAGTCG AAGTCCTGAA CGGCGACCGC GCCCAGCGGG CCGATTGCGA GCGCAGTTTC 
GGAGGCCGCG ACTTCGACGC CGTCATCGAC ACCACGCTTT ACAACGGCCG CGACGCCGCG 
ATCGCCACTG AAATCTTCGA AGGCCACGTC TGCCAATACA TTTTCATATC AACAGGACAG 
GTCTATCTCG TCCGCACCGG CCCGCAGCGT CCATTCCGCG AAACCGACTA CGACGGCCCG 
CTCATGCCGG AGCCGCCGAA AGACCATCAT CAAGATCACG ACAACTGGGT CTACGGCATC 
GAGAAGCGAG AGGCCGAAGA CATCCTCGCC GAGGTCCACG CGAAGCACGC TTTCCCATAT 
GTCTCGCTCC GCCTGCCGAT GGTCAACAGC GAGCGCGACC ACTACCATCG CCTGCAGAAC 
TACCTCCTTC GCATGTGGGA TGGCAGCCCG CTGCTCATTC CCGACGAGCC CGGCCTTCCG 
GTTCGACACG TTTACGGCCA GGACGTTGTT CGCGCCATCG AACTCTGTTT GGCGAATCGC 
GAAACCATCG GTCGCGCCTA CAACATCGGC CAGGACGAAA CGCTTTCCCT CCGCGAGTTC 
CTCGATCTCA CAGCCGAGAT CGCACATTCC AAGCCCCAGA TCGCCGCCTT CCCGCGCCCG 
TTGCTCGATT CCGCGCGCCT GCTGCCGGCA TGTTCGCCCT TCAGCGGTCC TTGGATGTCG 
AGTCTCGACA ACGCGCACAG CAAGCAGGAA CTCGGGATGA CGTACACCCC GCTTCGTGCC 
TATCTCGCCA AGCTGGTCGA GTATTTCCGC GAGCACCGCG AGCCGGCGCC GCCTGGCTTC 
GAAGAGCATC GCAACCGGGA ACTTGCTTTT GCACAGCATC ATGGAGCCTA G

Protein sequence

MRVLIIGGTR NLGPSIISAL VTAGHQVTIF HRGRTLYDLP REVEVLNGDR AQRADCERSF 
GGRDFDAVID TTLYNGRDAA IATEIFEGHV CQYIFISTGQ VYLVRTGPQR PFRETDYDGP 
LMPEPPKDHH QDHDNWVYGI EKREAEDILA EVHAKHAFPY VSLRLPMVNS ERDHYHRLQN 
YLLRMWDGSP LLIPDEPGLP VRHVYGQDVV RAIELCLANR ETIGRAYNIG QDETLSLREF 
LDLTAEIAHS KPQIAAFPRP LLDSARLLPA CSPFSGPWMS SLDNAHSKQE LGMTYTPLRA 
YLAKLVEYFR EHREPAPPGF EEHRNRELAF AQHHGA