Gene Sbal223_3174 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_3174
Symbol
ID	7085787
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	+
Start bp	3758694
End bp	3760049
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	45%
IMG OID	643462058
Product	beta-galactosidase
Protein accession	YP_002359082
Protein GI	217974331
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID	[TIGR03356] beta-galactosidase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00114145
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.862939
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATAT CTTTACCAAA GAACTCGATA CTCCAAAGCG AAGCGTTTAC TTTTGGTGTT 
GCGACCGCTT CCTTTCAAAT CGAAGGTGGC GTGGACTCTC GCCAAACCTG TATTTGGGAT 
ACCTTCTGTG CAACACCAGA TAAAATCCGT GATGCCTCCA ATGGCGATGT CGCCTGCAAC 
CACCTGAATC TATGGCAAGA AGATATCACC TTAATCGCGT CACTCGGGGT TGATGCCTAT 
CGTTTTTCCA TCGCATGGGG ACGGGTCTTA AATCAAGATG GCAGCATTAA TCAGCAGGGA 
GTTAATTTCT ACATTGGCAT TCTAGACGAA CTAAAACGTA GAAATATCAA AGCATTTGTC 
ACGCTTTACC ATTGGGATCT TCCTCAACAT ATTGAGGATC AAGGCGGCTG GTTAAACCGA 
GATACCGCTT ACCTTTTCAA AGACTATGCT GACAAAATAA GCCAAGCCTT CGGCGACCGA 
GTGTATTCCT ACGCCACTTT AAACGAACCC TTTTGCAGCT CATATTTAGG CTATGAGGCA 
GGCATTCACG CCCCAGGTTT AATGAAAAAA GCCTATGGCC GTCAATCGGC TCACCACTTA 
TTGCTCGCCC ACGGCTTAGC GATGCAAGTA CTGCAAAAGA ACAGCCCTAA CAGCATGAAT 
GGCATAGTTC TTAACTTCAC GCCTTGCTAC GCATTGACAG AAAGTGCTGC CGATATTCAA 
GCCGCAAAAC AAGCCGATGA TTACTTTAAC CAGTGGTATA TCAAGCCCAT TTTCGATGCG 
GTATACCCAG ACCTTCTCAC AGCATTAGCG CCAGAAGACA GACCGGAAAT TCACGACGGC 
GACCTTGAGC TTATCAGTCA ACCAATTGAT TTTTTAGGGG TTAACTTTTA TACCCGCGCC 
GTATATCAGG CCGATGCAGA ACAAGGATTT GTGCAAGTTG ATTTACCTGG GGTACCTAAA 
ACCGACATAG GCTGGGAGAT CCATCCACAG GCTTTTACCG ATTTACTGGT TTCTTTAAAT 
CAAACCTATG ATTTACCGCC TATTTTCATC ACAGAAAATG GCGCCGCTAT GGACGATAAA 
TGCATTGATG GGCGTGTCGA TGACTTCGAT AGGCTCAGCT ATTACCAACA CCATTTAACC 
GCAGTAGACA ATGCCATAGT ACAAGGTGTT AACATTCAGG GTTACTTTGC CTGGAGCTTG 
ATGGATAATT TTGAGTGGGC CGAAGGCTAC TTAAAACGTT TTGGCATTGT CTATGTGGAT 
TATGCAAGCC AAACCCGAAC GATAAAGGCC AGTGGTCAAG CCTACAGCGA CTTGATTCGC 
TCAAGGGCTC ACTTAACTAA TAACAATAAT AAATAA

Protein sequence

MKISLPKNSI LQSEAFTFGV ATASFQIEGG VDSRQTCIWD TFCATPDKIR DASNGDVACN 
HLNLWQEDIT LIASLGVDAY RFSIAWGRVL NQDGSINQQG VNFYIGILDE LKRRNIKAFV 
TLYHWDLPQH IEDQGGWLNR DTAYLFKDYA DKISQAFGDR VYSYATLNEP FCSSYLGYEA 
GIHAPGLMKK AYGRQSAHHL LLAHGLAMQV LQKNSPNSMN GIVLNFTPCY ALTESAADIQ 
AAKQADDYFN QWYIKPIFDA VYPDLLTALA PEDRPEIHDG DLELISQPID FLGVNFYTRA 
VYQADAEQGF VQVDLPGVPK TDIGWEIHPQ AFTDLLVSLN QTYDLPPIFI TENGAAMDDK 
CIDGRVDDFD RLSYYQHHLT AVDNAIVQGV NIQGYFAWSL MDNFEWAEGY LKRFGIVYVD 
YASQTRTIKA SGQAYSDLIR SRAHLTNNNN K