Gene Acid345_3265 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3265
Symbol
ID	4072677
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3867701
End bp	3868819
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	59%
IMG OID	637985286
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_592340
Protein GI	94970292
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.791109
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAAAAC GAATCCTGGT CACGGGCGGC GCGGGGTTTG TGGGATCGCA CTTGGTCGAC 
GCCTTGCTCC GTGCAGGCCA CAGCGTTCGC GTCTTTGACA ACCTCTCGCC CCAGGTGCAT 
CCACACGGCT TGCCAAGCTA TCTCGCCACC GACATCGAGT TCATTCAAGG CGACATGCGC 
GACCTTGACG CCGTTCGCCG CTCGCTCGAA AACATCGACG TCATCTTTCA CAAAGCCGCT 
GCTGTCGGCG TTGGACAGTC CATGTATGAG ATTTCCCATT ACATGAGCGC TAACACGCAG 
GGCACCGCCA ACTTGCTGCA AGCGATGCTC GACAGCCGCC GCGATTTCGA GAAGCTGGTT 
GTCGCCTCCT CAATGTCCAT CTACGGCGAA GGGAAGTACC GGTGCGCCGA GCACGGCGAC 
ATTGCTCCCG AGCCTCGGCC GATCGATCAA TTGCGGAAGA AGGAGTGGGA AGCGCTTTGC 
CCCGTCTGTA ACGCGAAGCT CGCGCCTATT CCCACCGACG AATCCAAGCG GTTGCAGTGC 
ACTTCCATCT ACGCCCTCTC GAAAAAAGAC CAGGAAGAGA TGTGTCTTCT CTATGGCCGC 
ACCTATGGAG CGCCGGTGGT CGCATTGCGA TACTTCAACA TCTACGGCAC GCGGCAGGCG 
CTTTCGAACC CTTACACCGG TGTGGCAGCG ATCTTTGCCT CGCGCTTGCT GAATCACCGC 
TCTCCCATGA TTTTCGAAGA TGGCGAGCAG CAGCGGGATT TCGTCAGTGT GCACGACATC 
GTGCAGGCGA ATTTGCTGGC TATGGACCGC GAAGAGGCGA ACGGCCTGGC CATCAACATC 
GGCTCAGGCG CGCCAATCTC GATTTCTCAA GTAGCTGACA TTCTCGGCGC CGCCCTCGGC 
CTTCACGTCG AGCCTGAAAT CACCGGCAAG TATCGCGCCG GAGACATTCG CCACTGTTTC 
GCTGACATCG GTCTGGCGCA GAAGGTCCTC GGCTACCGGC CCAAGCATCG CTTCGCGGAT 
GGCATCGGTG AGCTCGTTGC CTGGCTGCGC AATCAGTCCG CTACCGACAA GGTCTCGGAT 
GCCACGCAGC AGCTCACGGC TTACGGATTG ACGGCTTAG

Protein sequence

MRKRILVTGG AGFVGSHLVD ALLRAGHSVR VFDNLSPQVH PHGLPSYLAT DIEFIQGDMR 
DLDAVRRSLE NIDVIFHKAA AVGVGQSMYE ISHYMSANTQ GTANLLQAML DSRRDFEKLV 
VASSMSIYGE GKYRCAEHGD IAPEPRPIDQ LRKKEWEALC PVCNAKLAPI PTDESKRLQC 
TSIYALSKKD QEEMCLLYGR TYGAPVVALR YFNIYGTRQA LSNPYTGVAA IFASRLLNHR 
SPMIFEDGEQ QRDFVSVHDI VQANLLAMDR EEANGLAINI GSGAPISISQ VADILGAALG 
LHVEPEITGK YRAGDIRHCF ADIGLAQKVL GYRPKHRFAD GIGELVAWLR NQSATDKVSD 
ATQQLTAYGL TA