Gene Acid345_1147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1147
Symbol
ID	4069956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	1429465
End bp	1430571
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	59%
IMG OID	637983157
Product	aldose 1-epimerase
Protein accession	YP_590224
Protein GI	94968176
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2017] Galactose mutarotase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.934595
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTCCATA ACCGCATCTT GGCAGTCTTC TTCACGCTTT CTGTTCTCGC CTCACTTGCC 
CACGCCGCAA CCACCGTCAG CAAATCTGAG TTCGGCAAAA TGCCCGACGG CCGCTCCGTC 
GACATCTATA CCCTCAAAGA CGGCGCCATC GAAGCCCGTA TCACCACCTA CGGTGCGCGC 
ATCGTCTCCT TGCTTGCCCC CGACAAGAAC GGCAAAACCG CCGACATCAC CCTCGGCTAC 
GACAACGTTG ACGGCTACGT CAAAGACGGT GCATCCTTCG GTTCGCTCGT CGGCCGCTAC 
GCCGGTCGCA TCGGCAACGC AACCTTCAAC CTCGATGGCA AAGACTTCCA TACCCCCAAG 
AACGACGGCC CCAACACCTT GCACGGCGGA CCCGAAAATT TTGGCAAGCA GCTTTGGACA 
GGCAAGCAGA TTGCCAATGG CGTTGAACTG ACTTACGTCA GCAAAGATGG CGAAGCCGGT 
TTCCCCGGCA CCCTGACCAC AGTCGTCCGC TACACGCTGA TCGGCAAAGA CCTCAAGCTC 
GACATCTCCG CTGCCACCGA CAAGGACACC GTCCTCAACC TGACCAACCA CGCCTACTGG 
AACCTGGCTG GTGAAGGTAG CGGCGACGTC GCCAAGCAGG AAGTGCAGAT CAACGCCGCG 
AAAGTTGTCC CCGTAAACGA TGGCCTGATT CCCACCGGCA AACTCGCTGA TGTCGCCGGC 
ACGCCCCTCG ATCTTCGCAA GCTCACTCCC ATCGGTGCGC ACGTTGACGA CAAGTCGAAC 
GACCAACTCA AGTACGGCAT CGGCTACGAC ATCACCTACG TTCTCGACAA CAACGGTAAG 
CTCGTGCCCG CCTCCGAAGC CTACGATCCT GCCAGCGGAC GCGTTCTCAC CGTGCTCACC 
GACCAGCCCG GCCTGCATTT CTACAGCGGC AATCACATGG ACGGCGTAGC CGGCAAAGGT 
GGACACAAAT ACGCCTTCCG CAATGCCTAT GCCTTCGAAG CCCAGAATTT CTCCGACGCT 
CCGAACCAGC CCAACTTCCC CAGCGCCGTG CTGAAGCCCG GCCAGAAATT CCACCACATC 
ATCATCTTCC GTTTCTCGAC GAAGTAA

Protein sequence

MLHNRILAVF FTLSVLASLA HAATTVSKSE FGKMPDGRSV DIYTLKDGAI EARITTYGAR 
IVSLLAPDKN GKTADITLGY DNVDGYVKDG ASFGSLVGRY AGRIGNATFN LDGKDFHTPK 
NDGPNTLHGG PENFGKQLWT GKQIANGVEL TYVSKDGEAG FPGTLTTVVR YTLIGKDLKL 
DISAATDKDT VLNLTNHAYW NLAGEGSGDV AKQEVQINAA KVVPVNDGLI PTGKLADVAG 
TPLDLRKLTP IGAHVDDKSN DQLKYGIGYD ITYVLDNNGK LVPASEAYDP ASGRVLTVLT 
DQPGLHFYSG NHMDGVAGKG GHKYAFRNAY AFEAQNFSDA PNQPNFPSAV LKPGQKFHHI 
IIFRFSTK