Gene Acid345_0321 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0321
Symbol
ID	4068598
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	347992
End bp	349119
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	58%
IMG OID	637982324
Product	aldose 1-epimerase
Protein accession	YP_589400
Protein GI	94967352
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2017] Galactose mutarotase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.520613
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCGAA TCCCAAAAGT TCTCGTGCTG ACGCTCCTTG CTATTCTTAC CGTCGGCATG 
GCGGAAGCGA AAACCAACGT GACTAAGCAA ACATTCGGCA AAGTTCAGGA CGGCACTGCC 
GTCGACCTCT ACACCTTGAG CGACGGCCCG TACGAAGCCC GCATCATGAC CTACGGCGGC 
GTGCTTGTTT CCTTCAAAGC GCCCGATAAA GCCGGCAAGA CTGCCGACGT GATCCTCGGC 
TTCGACGATG CTGCCGGTTT CTATGACAAC TTCAACGGCG CGCACAATGC ATTTTTCGAC 
GCCATCATCG GTCGCTACGC CAATCGCATT GGCAAAGGTG CATTCACTCT CGACGGGAAG 
AAATACGACC TGCCGAAGAA CGATGGTCCG AACACGCTGC ATGGTGGCCC GCACGGTTTT 
AACAACGTGG TGTGGCAAGG CAAGCAACTC CCGAACGGCG TGGAACTCAC CTACGTGAGC 
AAAGACGGCG AGATGGGCTT CCCCGGGAAC ATGACCGCCA CCGTGAAGTA CACGCTCACC 
AAGGGCGATT TGCGGATCGA GTACTCGGCG ACGACCGACA AGGCCACTGT CGTGAACCTG 
ACCAATCACT CCTACTTCAA CCTGGCGGGC GAAGGGTCAG GCGACATTCT GAAACATCAG 
CTCATGATCA ACGCCTCGAA AATCACGCCC GTGGACGCGA CTTTGATTCC GACTGGCGAG 
CTGACTTCAG TCGACGGCAC GCCCTTCGAC TTCCGCAAAT CCACCGAGAT CGGCGCACGC 
ATCAACAACG ACGATGAGCA ACTCAAGCGC GGCCACGGCT ACGATCACAA CTGGGTGCTC 
GACTCAACAG GCGGTAAGCT TGCCGAGGCT GCAGAAGTGT ACGAGCCAAC TTCCGGCCGC 
GTGCTGAAAG TACTCACCGA TCAGCCCGGC ATCCAGTTCT ACTCCGGCAA CTTCCTCGAT 
GGCGCCGTAA AAGGCAAAGG CGGCAAGCCC TACACCCATC GCTCGGGATT GTGCCTGGAG 
ACGCAGCATT TCCCCGACAC ACCCAACCAC GCGAACTTCC CGTCCGCCGA ACTGAAGCCG 
GGACAGAAGT ACCACACCGT CACGGTCTTC AGTTTCTCGA CTCGCTAG

Protein sequence

MQRIPKVLVL TLLAILTVGM AEAKTNVTKQ TFGKVQDGTA VDLYTLSDGP YEARIMTYGG 
VLVSFKAPDK AGKTADVILG FDDAAGFYDN FNGAHNAFFD AIIGRYANRI GKGAFTLDGK 
KYDLPKNDGP NTLHGGPHGF NNVVWQGKQL PNGVELTYVS KDGEMGFPGN MTATVKYTLT 
KGDLRIEYSA TTDKATVVNL TNHSYFNLAG EGSGDILKHQ LMINASKITP VDATLIPTGE 
LTSVDGTPFD FRKSTEIGAR INNDDEQLKR GHGYDHNWVL DSTGGKLAEA AEVYEPTSGR 
VLKVLTDQPG IQFYSGNFLD GAVKGKGGKP YTHRSGLCLE TQHFPDTPNH ANFPSAELKP 
GQKYHTVTVF SFSTR