Gene Acid345_0901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0901
Symbol
ID	4069112
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	1127585
End bp	1129642
Gene Length	2058 bp
Protein Length	685 aa
Translation table	11
GC content	55%
IMG OID	637982908
Product	Beta-galactosidase
Protein accession	YP_589978
Protein GI	94967930
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1874] Beta-galactosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.240206
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGCAT TAAAACGGCT ATTGGTCTTC AGCGCAGTTG CTGGATTGCT CACCGTGTTC 
GCTCCAGCTC AGAAGACGAA CGCGCCATCG AATTCAGGAT TGATGCTGGG AGTTGCATGG 
TATCCAGAGC AATGGCCCGA AGACCGCTGG GAGAAAGATC TCGTCCTCAT GCAAGCGGCG 
GGAATCCACG TAGTGCGTAT CGGAGAGTTC GCGTGGAGCA CGATGGAACC GAGCGAGGGA 
AAATACGAAC TCGATTGGCT CCAGCGCGCG ACCCGACTCG CTGCGAAGCA TCACATCGAC 
GTCATTCTTG GCACTCCTAC TGCGGCCCCT CCAGTCTGGT TAACTCAGAA ATACCCCGAT 
ACTTTGCTCA TCGACGAACA GGGAAAACGC GCGGTGCATG GCAATCGCGC CCACTTTTCA 
TTCACGAGCC CACGCTACCG CGAGTTCTGC CGCAAGATTG CGGAAGAGAT GGCGCGGAAA 
CTGGCGAAAG AGCCGAACGT TATCGGCTGG CAACTGGACA ATGAGGTTTC CAATCCGTCG 
TATGACGGGT ACACACGCGC GCAGTTCCAG GAATGGCTGA AGGACAAATA TAAGGGTCTC 
GACGCTCTCA ATCAGCACTG GACGACAGCC TACTGGAGTC AAACGTACTT CGATTGGTCG 
CAGATTCCGA TCCCAGTGGG CGGCAATAAC CCCGGCCTCA TGCTCGATTG GAAACGGTTC 
ATCACCGACA CTTGGTATAG CTATCTTTCG AATCAGATCG CGGCAATTCG CAAGTACGCG 
CCGGCGTCCC AACCGATTTG TACAAACACA ATGGGACTCT TCGATGGTTT CGACCACTAC 
AAAGTTGAAA GTGAACTCGA CATCGTCGCG TGGGACCATT ACGTCGGCCA GGGCCACCTT 
AATCCGGACT TTGCCGGATT CATCCACGAC CTGAATCGCG GATTGAAGCA GAAGAACTTC 
TGGGTGATCG AGACACAACC GGGCGCGGTG AATTGGCAAT CGATCAATAA CGTGTTGGAC 
AAAGGTGAAG TGCGAGCGAT GGCTTGGCAC GACGTTGCGC ACGGCGCGGA CATGGTGAGT 
TATTGGCAAT GGAGAAGCGC ACTGAATGGG CAGGAGGAAT ATCACGGAGT GCTGGTGGGC 
GCGGACGGCA CCCCTGTTCC GGTTTACGAC GAAGTGAAAC AGGTTGGTAA CGACTTCGCG 
AAGGCGTATC CAGTTCTCGC GGGAACGTCG CCGCATTCCG AAGTTGCGAT GCTGCATGAC 
TACGACAGCC GTTGGGCGAT CGATTGGCAG AAGCACAATC GCAACTACGA TCAGATCAAA 
ATCCATGTCT CGTACTACCA CGCCCTCCGA AAACTGGTCC ACAGCATAGA TGTCGTGAAT 
CCTTCAGTTG CACTCAAAAA CTACAAAGTC GTCGTTGCTC CAAATCTGAG TCTCATTCCC 
GACTCGCTGG CAAAGCATTT GCGTGAATAC GTGGAACAAG GGGGGCATCT CGTCCTCGGG 
CCGAGAGCCG GCATGAAAGA CGAGTTCAAC GCGTTGCTTA CGGAACGACA GCCTGGAGCA 
CTGGTCGATA CTCTCGGCGG GCGAGTGGAG CAATTCTATG CTTTGGATCA GGACGTTCCT 
CTCGAAGGCC CTCTTGGGTC GGGGCACTCT TCCCTCTGGG CCGAACAACT TAGCGCAAAG 
CCGGGAACGG ATGCCTTGCT CACCTTTGGA AAAAGCAACG GTTGGCTCGA CCGTCAGCCT 
GCAATCATCT CGCGCAAAGT CGGGAAGGGA AGAATCACAT ACGTGGGGGC CGTGCTCGAT 
GAATCCCTGA TGGACAAATT TGCCGGATGG ATATTCTCGA CCAGTGGATT GCATTCTGCA 
TTTGGTCTCA TTCCGGATGG TGTTGATGTT TCGGAGCGAA GTGGCAATGG GAAAGACGTG 
TTCGTGCTCA TTAACTTCAA GCAAGAGAAC CAAAGCGTGC AACTCCCGAA GAGCATGAAG 
CGGGTACTCG CGAATGGGGA ATCGGTGAGT AGCGTAAATC TGCCGCCGTA CGGAGTGGAG 
GTCCTGGAGG CGCAATGA

Protein sequence

MNALKRLLVF SAVAGLLTVF APAQKTNAPS NSGLMLGVAW YPEQWPEDRW EKDLVLMQAA 
GIHVVRIGEF AWSTMEPSEG KYELDWLQRA TRLAAKHHID VILGTPTAAP PVWLTQKYPD 
TLLIDEQGKR AVHGNRAHFS FTSPRYREFC RKIAEEMARK LAKEPNVIGW QLDNEVSNPS 
YDGYTRAQFQ EWLKDKYKGL DALNQHWTTA YWSQTYFDWS QIPIPVGGNN PGLMLDWKRF 
ITDTWYSYLS NQIAAIRKYA PASQPICTNT MGLFDGFDHY KVESELDIVA WDHYVGQGHL 
NPDFAGFIHD LNRGLKQKNF WVIETQPGAV NWQSINNVLD KGEVRAMAWH DVAHGADMVS 
YWQWRSALNG QEEYHGVLVG ADGTPVPVYD EVKQVGNDFA KAYPVLAGTS PHSEVAMLHD 
YDSRWAIDWQ KHNRNYDQIK IHVSYYHALR KLVHSIDVVN PSVALKNYKV VVAPNLSLIP 
DSLAKHLREY VEQGGHLVLG PRAGMKDEFN ALLTERQPGA LVDTLGGRVE QFYALDQDVP 
LEGPLGSGHS SLWAEQLSAK PGTDALLTFG KSNGWLDRQP AIISRKVGKG RITYVGAVLD 
ESLMDKFAGW IFSTSGLHSA FGLIPDGVDV SERSGNGKDV FVLINFKQEN QSVQLPKSMK 
RVLANGESVS SVNLPPYGVE VLEAQ