Gene Acid345_0903 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0903
Symbol
ID	4069114
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	1131222
End bp	1132379
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	56%
IMG OID	637982910
Product	xylose isomerase
Protein accession	YP_589980
Protein GI	94967932
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2115] Xylose isomerase
TIGRFAM ID	[TIGR02631] xylose isomerase, Arthrobacter type

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.122683
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGATG CTTACCAGCC GCGACCGGAA CACAAGTTCT CGTTCGGCCT TTGGACGATC 
GCGAACCGCG GCCGCGATCC TTTCGGCGAT GCAGTGCGCC CCACTATCCC TCCGAACGAC 
ATTGTCGCTT TGCTCCGCGA GGTAGGCGCA TGGGGGGTCA ATCTTCACGA TAACGATCTT 
GTTCCAATTG ACGCGACGCC ATCCGAGCGC GACAAGATCG TCCGCGATTT TCAGGCGGCC 
TGCAGGCAGC ACGGCATCGT CGTGCCGATG GCGACGGTCA ACTTGTTCTT CGATCCAATC 
TTCAAAGATG GAGCTTTCAC CGCAAACGAC GCCGATGTGC GTGCGTACGC TCTTCAGAAG 
ACGATGCGCG CTATGGATCT CGGCGCCGAG TTAGGCGCTA AGCTCTTTGT GCTCTGGGGT 
GGGCGCGAAG GAACTGAGAC TGATGCGTGC CGCCGTCCCG AAGAACCCTT CAAGCGGTTG 
CGCGAAGCCA TCGATTATTT GTGCGAATAC AATCTCGACA AAAAGTATGG TTTCAAATTT 
GCGTTGGAGG CCAAGCCAAA CGAACCTCGC GGCGACATAT ACATGCCGAC GACTGGTGCC 
TATCTCGGTT TCATCCCAAC CCTTGCGCAT CCGGAGATGG TTGGTGTAAA TCCTGAGGTC 
GCGCACGAGC ACATGGCGGG ATTGAACGCG CTTCACGCGG TTGCGCAAGC ATGGGAAGCG 
GGCAAACTCT TCCACATCGA TCTAAACGAT CAGAACCCTG GGCGCTATGA CCAGGATTTT 
CGTTTTGCAT CTGCAACCCC AAAATCAATG TTCTGGTTGG TGAAGTTCCT TGAAGACTCG 
GGGTATCAAG GGCCGCGCCA CTTTGACGCG CACGCTTACA GGACAGAAGA CATCGCCGGC 
GTAAAGGATT TTGCGCGCGG ATGCATGCGA AGCTACCTGA TCCTGAAGGA AAAGGCGCAG 
CGCTGGAATG CCGACAAGGA GATCCAGCAA ATCTTCTCCG AGATCAACCC GCAAACCACC 
GGCAGCTCGA AATATTCACA CGATGGCGCT CTGTCTCTTC TCAACCGCAC CTATGATCGC 
GCAGCCATTG CGAAGCGCGG CCTGCAATAC GAGCGCCTCG ATCAGCTGAC TATGGAACTG 
TTGTGGGGAA TACGGTAA

Protein sequence

MSDAYQPRPE HKFSFGLWTI ANRGRDPFGD AVRPTIPPND IVALLREVGA WGVNLHDNDL 
VPIDATPSER DKIVRDFQAA CRQHGIVVPM ATVNLFFDPI FKDGAFTAND ADVRAYALQK 
TMRAMDLGAE LGAKLFVLWG GREGTETDAC RRPEEPFKRL REAIDYLCEY NLDKKYGFKF 
ALEAKPNEPR GDIYMPTTGA YLGFIPTLAH PEMVGVNPEV AHEHMAGLNA LHAVAQAWEA 
GKLFHIDLND QNPGRYDQDF RFASATPKSM FWLVKFLEDS GYQGPRHFDA HAYRTEDIAG 
VKDFARGCMR SYLILKEKAQ RWNADKEIQQ IFSEINPQTT GSSKYSHDGA LSLLNRTYDR 
AAIAKRGLQY ERLDQLTMEL LWGIR