Gene Acid345_3813 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3813
Symbol
ID	4071097
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4507820
End bp	4508815
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	54%
IMG OID	637985836
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_592887
Protein GI	94970839
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.168438
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.238091
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAGCG CGATCTCAAA GTCGTCTCCC ATTTTTGTGG CTGGCCACCG CGGGCTTGCG 
GGGTCTGCAA TCGTGCGGCG CCTGCAGAGG GCGGGTTACG AGCGCCTATT TCTTAAAACG 
CACTCGGAGT TGGATCTCTC AGACGAGATC GAAGTTCGAA AATTCTTCGA CCGTTACCGC 
CCGGAATGCG TGTTTTTAGC CGCTGCAAAG GTGGGTGGAA TCCTTGCTAA CCGGGATTAT 
CCAGCGGATT TCTTCATTCA AAATGCGCGT ATCCAAAACA ATGTCATCAG CACGTCTTTT 
CAATTCGGCG TGAAGCGGAT GGTATTTCTC GGCTCCAGTT GCATTTACCC GAAACTTGCA 
CCGCAGCCTC TCAAGGAAGA ATACCTTCTT ACGGGACCGC TCGAGTTTAC AAATCGTTCA 
TACGCGGTGG CTAAGATCGC CGGTATCGAA TTGTGCTGGG CGCTGAATCG GCAGCACGGT 
ACAAAGTTCC TGGCTGCGAT GCCGACCAAC CTCTATGGGC CCGGCGACAA TTACGATCGG 
AACGGATCCC ACGTACTTCC AGCGTTGATT CGAAAAGTTC ATGAGGCGAT CGAAGGACGT 
CAGGAAACTG TCACAGTTTG GGGAAGTGGC GAGCCGCGCC GTGAATTCTT GTATAGCGAC 
GACATGGCAG ATGCCTGCGT CTTTCTCATG GAATTGGCGG AAGAAACCTA CGATGCGTTC 
GTCTCCGATC CCGAGCGACC GCCCTTGTTG AATATTGGAT GTGGAGAAGA TCTCACCATT 
TCTGCTTTGG CCCATCTAGT GGCAAAGGAA CTTGGCTACG AGGGCGAGAT CGTATTTGAT 
CCCTCCAAGC CGGACGGAAC GCCACGAAAG CTTCTCGATG TGTCCCGCTT GTTCCAAATG 
GGTTGGCGTC CGAAAATGTC GTTGGCTGCC GGAATCCGGG AAGCTTACGC CGATTTCAAG 
GTCCGGTATT CGTCGATCGC AGCTGCGTCT CGATAG

Protein sequence

MSSAISKSSP IFVAGHRGLA GSAIVRRLQR AGYERLFLKT HSELDLSDEI EVRKFFDRYR 
PECVFLAAAK VGGILANRDY PADFFIQNAR IQNNVISTSF QFGVKRMVFL GSSCIYPKLA 
PQPLKEEYLL TGPLEFTNRS YAVAKIAGIE LCWALNRQHG TKFLAAMPTN LYGPGDNYDR 
NGSHVLPALI RKVHEAIEGR QETVTVWGSG EPRREFLYSD DMADACVFLM ELAEETYDAF 
VSDPERPPLL NIGCGEDLTI SALAHLVAKE LGYEGEIVFD PSKPDGTPRK LLDVSRLFQM 
GWRPKMSLAA GIREAYADFK VRYSSIAAAS R