Gene Acid345_0664 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0664
Symbol
ID	4069756
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	820956
End bp	823010
Gene Length	2055 bp
Protein Length	684 aa
Translation table	11
GC content	57%
IMG OID	637982670
Product	glycoside hydrolase, clan GH-D
Protein accession	YP_589743
Protein GI	94967695
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3345] Alpha-galactosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.250528
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTTA CCTCCATGCA CCGATGCCTT CCGTTGCGGG GAAATCCGCG ACGGAAGGCC 
CTTTTCACCG CGCTCTTAAT GGGCGTCTTC GCGGCCGGAG CGAGCGGCCA GACCAAGATC 
GAAGGCAAGC AGATTGCCAT AGAATTCGAC GCCCAAATGC ACTCCCGCGC AGTGGCATTC 
GGCGAGACGC CATTCGGCGA TTTCAGCAGC TCGGAAAGCG TTGTCGTTGA CGGTAAGACG 
CTTTCGGACT TCGCACAGAC TTCACAGCGC ACGGAAGGCG TATCCGACAT GCTTGGTGCA 
GGGAAGCGCC TGATCATCGA AGGCAAGTCC GGCGATGTTT TCAAGACCGT GACCGTCAGC 
GTCTACGACG ATTTTCCCAA TGCCGCAGTC TTCGACGTCT CCTACAAAAA CGCTGCGTCA 
TCTTCGATAG AAATCTCGAA GTGGACGAAC AACGCGTATT CGGTCACTGG CTCATCGTTG 
TGGTCGTTCG AACCCGGAAC CTACGAGCGA CGCCCTGCTT GGGTAGCGCC GCTAAAGGTC 
GGCTTTCACC AGAAGAACTA TCTCGGGATG AACGCCAGCG ACTACGGTGG CGGAACGCCG 
TTCGCCGACA TCTGGTCGCG CAAAGCCGGT CTCGCGATTG GCGACCTCGA ACTGAAGCCT 
AAGCAGGTCT CCCTGCCCGT CGCCATGCCC GACGCGAAAC ACGCCACCCT CAGCATCGAA 
TTCGTAAACA CACAAAAGCT CGCGCCGGGT GAATCGCTAA CAACCTTCCG AACTTTTGCC 
ATTGTTCATC ATGGCGACTA TTTCGCTGCC CTGCTCACTT ACAAGAAACT CATGCAGAAG 
CTCGGCCAGC CCGCATCGCA GCGCGCCGCC GATGGTGGTT TCCGGCCGAT GTGGTGCGCC 
TGGGGCTATG GACGCCGCTT TACCGTGGCT CAGATAGAGA AGACCATTCC CGAAGCCAAG 
CGCATCGGCT TCGAGTGGGT CACTGTTGAC GATGGCTGGC AGACGAAGTA TGGCGATCTG 
ACGCTGGATC CGAAGAAGTT TCCTCGGGGC GATGCCGACA TGAAAGCGCT GGTGGATAAA 
ATCCACGCCG CCGGCATGAA GGCGCAGTTA TGGTGGTCGC CGATGAGCGC CGCGCCGGAC 
TCGGCGTTAC TCAAAGACGA TCCGGACCTC GAGCTGAAGA ACAAGGATGG TTCCCCGCAG 
AAAATCTCGT GGTGGAATTC GCTGTATCTG TGTCCTGCGT ACGAGCCAGC GGTTGAGGTT 
CAGCGCAAGT TCGTGCAGAA GATCATAGGT GAATGGGGCT TTGATGGTCT CAAGCTCGAC 
GGCCAATACA TGAACGCTGT CCCGGCGTGC TATAACCCTG CGCACCATCA CGCAAAGCCG 
GAAGATTCCG TCGAGCAACT GCCGTTGCTC TTCAAAGCCA TTTACGACGA AGCGCAGAAG 
GAAAAACCTG GCGCGCTGAT TGAGTTCTGT CCTTGCGGCA CGTCGTATTC CTTCTACACC 
ATGCCGTACT ACAACATGAG CGTCGCGAGC GATCCTTCGA GTTCCTGGCA GGTGCGTACT 
AAAGGGAAGA CGATCAAAGC TCTGCTCGGT GACGGCGTGC CGTACTTCGG CGATCACGTC 
GAGCTGAGCG ACAACGCCAG CGACTTCGCC TCGACCGTCG GCGTCGGCGG CGTTGTCGGC 
TCGCAATTTA CCTTGCCTGC AGTTGCTTCG CGGCATACCC AATTTGATCT TGTTCCTGCG 
CGCCGCAAGA TCTTCGAGAA GTGGGTCGGC CTTTACAAGG AGAAGATGCT GAGCGAAGGC 
ACCTACGAGG GCACTCTCTA TGACATCGGC TTTGATCGTC CAGAGGCTCA CGCGATTAAG 
AAGGGCAGCG CAATGTACTA CGCGTTCTAC GCTCCGACTT TCAGCGGCAA AGTGGAACTG 
CGCGGCCTGG AAGATCGCGA CTACAAAGTG ACCGATTACG AGAACAACAA AGTGTTGGGG 
CCGGTCCACG GTCCGACAGC ACAACTGGAA ACAAGTTTTT CGAAACACTT GATGCTGGAA 
GCGGACCCGC AATGA

Protein sequence

MKLTSMHRCL PLRGNPRRKA LFTALLMGVF AAGASGQTKI EGKQIAIEFD AQMHSRAVAF 
GETPFGDFSS SESVVVDGKT LSDFAQTSQR TEGVSDMLGA GKRLIIEGKS GDVFKTVTVS 
VYDDFPNAAV FDVSYKNAAS SSIEISKWTN NAYSVTGSSL WSFEPGTYER RPAWVAPLKV 
GFHQKNYLGM NASDYGGGTP FADIWSRKAG LAIGDLELKP KQVSLPVAMP DAKHATLSIE 
FVNTQKLAPG ESLTTFRTFA IVHHGDYFAA LLTYKKLMQK LGQPASQRAA DGGFRPMWCA 
WGYGRRFTVA QIEKTIPEAK RIGFEWVTVD DGWQTKYGDL TLDPKKFPRG DADMKALVDK 
IHAAGMKAQL WWSPMSAAPD SALLKDDPDL ELKNKDGSPQ KISWWNSLYL CPAYEPAVEV 
QRKFVQKIIG EWGFDGLKLD GQYMNAVPAC YNPAHHHAKP EDSVEQLPLL FKAIYDEAQK 
EKPGALIEFC PCGTSYSFYT MPYYNMSVAS DPSSSWQVRT KGKTIKALLG DGVPYFGDHV 
ELSDNASDFA STVGVGGVVG SQFTLPAVAS RHTQFDLVPA RRKIFEKWVG LYKEKMLSEG 
TYEGTLYDIG FDRPEAHAIK KGSAMYYAFY APTFSGKVEL RGLEDRDYKV TDYENNKVLG 
PVHGPTAQLE TSFSKHLMLE ADPQ