Gene Acid345_0326 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0326
Symbol
ID	4070088
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	353576
End bp	355078
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	60%
IMG OID	637982329
Product	L-arabinose isomerase
Protein accession	YP_589405
Protein GI	94967357
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2160] L-arabinose isomerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.562727
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGATC TGAAGAAGTT CGAGGTCTGG TTTGTTACCG GTAGCCAGCA TCTCTACGGC 
CCGGAGACGC TGGAGAAGGT CGCGGAACAT TCGCGCGAGA TTGCGGGTGG ACTCGATGCC 
ACGCCGCAGA TGCCTGTTCG CGTCGTTTTC AAGCCGGTGC TCACCACCGC AGACGCCGTC 
CACGAACTCT GTCGCGAGGC CAACAACGCC GCTCACTGCA TCGGTCTCGT CACCTGGATG 
CATACCTTCT CACCCGCCAA GATGTGGATT GCCGGGCTGA AGGCGCTGCA GAAACCATTC 
CTACATCTCC ACACGCAATA CAACCGTGAG TTGCCGTGGG CCACCATCGA CATGGATTTC 
ATGAACCTGA ACCAGGCCGC GCATGGCGAC CGTGAGTTCG GCTTCATCGG CAGCCGCATG 
CGCCTCGACC GCAAGGTCGT GGTTGGCTTC TGGCAGGATC TCGAAGTTAT CTCCGAGCTT 
GGCACCTGGG CGCGCGCTGC GGCGGGTTGG CACGATGCGC AACATTTGAA AGTCGCACGT 
TTTGGCGACA ACATGCGAAA CGTTGCCGTG ACTGAAGGCG ACAAAGTGCA GGCGAAAATC 
CAGCTCGCCT ACTCGGTAGA TGGCTTCGGT GTCGGCGATC TCGTGGCCCG CATTCACGCC 
GCAAGCGACA GGGATGTAGA CCATCTAGTA TCAGAATACG AGGACACCTA CACCCTCTCC 
GAGCCGCTGA CCGCGAAGGG CAAGCAACGC GCGTCTCTGC TCGACGCTGC ACGCATCGAG 
CTTGGCCTGC GCCATTTCCT CAAAGACGGC AACTTCCACG CCTTCACCGA CACCTTCGAA 
GACCTCCACG GCCTTAACCA ACTCCCGGGC ATCGCGGTGC AACGTCTGAT GGCGGACGGT 
TACGGCTTCG GCGCTGAAGG CGATTGGAAG ACTGCCGCGC TGGTTCGCAC CATGAAAGTG 
ATGGCCGCCG GACTCGATGC CGGTACGTCA TTCATGGAGG ACTACACCTA TCACCTTGAG 
AATGGCGGGC TCGTACTCGG GGCTCACATG CTTGAGATTT GCCCCTCGAT CGCCAGCGGC 
AAGCCTTCGT GCGAGATCCA TCCCCTCAGC ATCGGTGGCA AGGGCGATCC CGTGCGCCTT 
GTCTTCGACT CGCAGACCGG TCCTGCCGTC GTGGCGACAA TCGTGGACGT CGGCGAGCGC 
TTCCGGATGG TCATCAACAA AGTGAATGTC ATTCCGCCCG AGGTGCCTTT GCCCAAATTG 
CCCGTAGCGC GCGCTGTCTG GATTCCTGAG CCGAACCTGG CCGTGGCCGC CGCATGCTGG 
ATCTACGCCG GCGGCGCACA CCACACCGGC TTCAGCTTGT GCCTTACCGC CCAACATCTC 
CAGGACTATG CCGAAATGGC GGGCATCGAG TGCGTGCTGA TCGACAACGA CACCACTGTT 
CACGCTTGCA AGAACGAGTT GCGCTGGAAC GACGCTTATT ACCGCTTGAC GGGTTGGCGC 
TGA

Protein sequence

MIDLKKFEVW FVTGSQHLYG PETLEKVAEH SREIAGGLDA TPQMPVRVVF KPVLTTADAV 
HELCREANNA AHCIGLVTWM HTFSPAKMWI AGLKALQKPF LHLHTQYNRE LPWATIDMDF 
MNLNQAAHGD REFGFIGSRM RLDRKVVVGF WQDLEVISEL GTWARAAAGW HDAQHLKVAR 
FGDNMRNVAV TEGDKVQAKI QLAYSVDGFG VGDLVARIHA ASDRDVDHLV SEYEDTYTLS 
EPLTAKGKQR ASLLDAARIE LGLRHFLKDG NFHAFTDTFE DLHGLNQLPG IAVQRLMADG 
YGFGAEGDWK TAALVRTMKV MAAGLDAGTS FMEDYTYHLE NGGLVLGAHM LEICPSIASG 
KPSCEIHPLS IGGKGDPVRL VFDSQTGPAV VATIVDVGER FRMVINKVNV IPPEVPLPKL 
PVARAVWIPE PNLAVAAACW IYAGGAHHTG FSLCLTAQHL QDYAEMAGIE CVLIDNDTTV 
HACKNELRWN DAYYRLTGWR