Gene Sbal223_2157 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_2157
Symbol
ID	7085963
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	+
Start bp	2563130
End bp	2565013
Gene Length	1884 bp
Protein Length	627 aa
Translation table	11
GC content	49%
IMG OID	643461058
Product	glycoside hydrolase family 43
Protein accession	YP_002358082
Protein GI	217973331
COG category	[R] General function prediction only
COG ID	[COG3940] Predicted beta-xylosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000434172
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0029689
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACTTATT CTCTGACTAA ATTAGTCGCC GTAATGGCGC TGTCATCCTG CTTGGGGGCA 
GGTATGGTTC ACGCATCGCC CATATCAACG GACGATAACC GCATCACCAG CGAAACGTTT 
GCCAACCCTT TGTTTAGAAA TGGGGCAGAT CCTTGGCTTG AATACTTTAA TGGTAACTAT 
TATCTGACCA CGACAACGTG GACTTCTGAA TTAGTGATGC GCAAATCGCC CACGATTGCC 
GGACTTGCCG ATGCTCCCGC ACACAATATT TGGACCGGTG CAGATAAATC ACGTTGCTGT 
AATTTTTGGG CATTTGAATT CCATCCAATG CAAACCGCCG ATGGTCTACG CTGGTATGTT 
ATCTATACCT CAGGTGTTGC GGAAAACTTT GACGGTCAGC GCAATCATAT CCTTGAGAGT 
GAAGGCAGCG ATCCCATGGG TCCATACACC TATAAAGGTA CGCCTATGCC GGATCATTGG 
AATATCGACG GCAGTTATTT GGAATATAAG GGACAGTTGT ATTTCCTTTG GTCTGAGTGG 
CACGGTAAAG ATCAAGTCAA TTTAATCGCT AAGATGAGTA ATCCTTGGAC AATTGAAGGC 
GAGCATAAGG TGATCACTCA GCCTACTTAC GCTTGGGAAA AGTCCGGTCT AAACGTGAAT 
GAAGGACCTG AAATCATTCA GCACCAAGGA CGCACGTTCC TTGTGCATTC GGCAAGCTTT 
TGTAACACAG AAGATTACTC GCTTGGCGTG GTCGAACTTA CGGGCACCGA TCCTATGGAT 
CCCGCTGCGT GGACGAAATA CGACAAACCT TTTTTCAGTA AAGCCAATGG GGTTTATGGC 
CCTGGCCATC ACGGATTCTT TACCTCCCCC GACGGCAGCG AAGATTGGTT GGTTTACCAC 
GGCAACTCTT CACCCACAGA TGGTTGCAGT GGCACACGAT CCGCCAGAGC CCAACCTTTT 
AAATGGGATG ACAAAGGCCT GCCTAACTTT GGTGAGCCAA TGGCAGACAA GCAACCCTTA 
CGCGTTCCAA GTGGTGAGTT TGGGCCATTG AAAGCCCAAG TTGAAGGGGT GAAATACCGT 
ATTGTTAACC ATGATACCGA CCAGTGCCTC ATCACCAATG CCAAAGGCGA TGTCAGCGTT 
AGCCGTTGTG ACGATAAAGC AAGTACTTGG GTGGTTGATC CCACCAATGA CGGACTTTAT 
CGATTTGCTA ACGTGGCCGA AGGCACCTTT CTCACCCAAG AAAATTGCCA AGACAGTGAA 
GCCTTGGGCG TGAGTGCTGC GCCTTGGGTT GCTTCCCGTT GCCAACGTTG GTCAGTGGAT 
GCCAGCCATG ATGGCTGGTT CCGTTTTGCC AATGAGCGTT CTATTCAAAA TCTGCAAGCC 
ACCAATTGCA CTACCCAAAA GGGCGCAGCT GTCGTTACCG GCGAAAACCG CGTCAGCGAT 
TGTACTGACT GGCGGATTGA ACCGGTATCT CATTTAGCGA TTGTAAATGC CCACAGTGGA 
CGAGTGGTGT CGGCGCAACA ATGCGACGTT AAAGCCAATG CCAATGTGGT TCAACATGAA 
TATACCGCCA ATGCCTGCCA GCAATGGCAA GCAACATCCA CCAGTGATGG TTATTACCGC 
CTGCAATCGA AGCAGCTAAC GGCGAACAAA CAAGCCCAAT GCTTAGTGAG TGTTGATGGC 
AACTTGCAGC TGGGTGGTTG CGAGCAGGCG GACAGTGAAT GGCGAACTGA GTTTATGCCA 
AATGGTTCAC TGCGTGTGGT ATCGCGTAAG GGCGGTTCAT CGATGAAAGT GGCAGGCGAG 
TCCTATGCCA ATGGCGATAA TATCGTTGAG GATGTCTGGA AAAATACCAT TTCGCAGCAG 
TTCTATTTCA GAGAGGTGAA ATAG

Protein sequence

MTYSLTKLVA VMALSSCLGA GMVHASPIST DDNRITSETF ANPLFRNGAD PWLEYFNGNY 
YLTTTTWTSE LVMRKSPTIA GLADAPAHNI WTGADKSRCC NFWAFEFHPM QTADGLRWYV 
IYTSGVAENF DGQRNHILES EGSDPMGPYT YKGTPMPDHW NIDGSYLEYK GQLYFLWSEW 
HGKDQVNLIA KMSNPWTIEG EHKVITQPTY AWEKSGLNVN EGPEIIQHQG RTFLVHSASF 
CNTEDYSLGV VELTGTDPMD PAAWTKYDKP FFSKANGVYG PGHHGFFTSP DGSEDWLVYH 
GNSSPTDGCS GTRSARAQPF KWDDKGLPNF GEPMADKQPL RVPSGEFGPL KAQVEGVKYR 
IVNHDTDQCL ITNAKGDVSV SRCDDKASTW VVDPTNDGLY RFANVAEGTF LTQENCQDSE 
ALGVSAAPWV ASRCQRWSVD ASHDGWFRFA NERSIQNLQA TNCTTQKGAA VVTGENRVSD 
CTDWRIEPVS HLAIVNAHSG RVVSAQQCDV KANANVVQHE YTANACQQWQ ATSTSDGYYR 
LQSKQLTANK QAQCLVSVDG NLQLGGCEQA DSEWRTEFMP NGSLRVVSRK GGSSMKVAGE 
SYANGDNIVE DVWKNTISQQ FYFREVK