Gene Sbal223_2151 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_2151
Symbol
ID	7085957
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	+
Start bp	2555209
End bp	2556387
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	49%
IMG OID	643461053
Product	Alpha-N-arabinofuranosidase
Protein accession	YP_002358077
Protein GI	217973326
COG category	[R] General function prediction only
COG ID	[COG3940] Predicted beta-xylosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.923723
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.103273
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGCAA ACCTAGCCAT GGATAAGTTA ACCTCAATGA CTCGCTCTAA ACCTATTAGC 
TATAAGCATG GTAACGCTAA TCGAATTGAC CCTAAATCAA ACCGTTTGTC GGCACTGGCG 
GTGTCAATTG CGCTGTCGGT TTGTATGGCA AGCCCTGCGA ATGCAGTGCC TGTGATTGAG 
CATAAAGCTG TCGTTCATCA GGCCATTGAT GCGCAAAAGA CCACATCCAC CATTCAAAAT 
TTGCCTTTTA TTGCCCGTAG TGCCGATCCT TGGGTGATTA AAGCCGACGA TGGCAGTTAT 
TACTTTATCG CCTCTGTACC TGAATTCGAT CGAATAGAAC TGCGCCATGC CGCCACGATT 
CAAGGGCTGA GCCAAGCAAA GCCTAAGATC ATTTGGCGTA AGCATGAGTC TGGGCCCATG 
AGCATCGACA TTTGGGCGCC CGAACTACAT AAGATTGATG GCCGTTGGTA TATCTATTAT 
GCCGCCAGTG ATAAAGACCT ACGTTTTCAT AACCGTATGT TTGTATTAGG CTTAAATGGC 
GATGATCCGA TGGCGGGTGA GTGGCAGGAA CTCGGACGCC TTAAGACGGC GCACGATGCA 
TTTTCTTTAG ATGCCACCAG CTTTCAAGTA GGCGAACAGC GTTATTTTAT TTGGGCGCAG 
CAAGATGAGG CTAAAAGTTA CAACACGGGA TTGGTGATCG CCAAAATGGT ATCGCCGACG 
CAGGCGTCAG CACAGGAAAC CATCATCACC GAACCTTTGC TCAACTGGGA AAGACTGGGT 
TTTAAAGTCA ACGAAGGCGC TGCCGTGCTC ATTAAAAATG GCAAAGTCTT TGTGACCTAT 
TCCGCCAGCG CCACAGATGA TCGCTACGCT ATAGGTTTAC TGTGGGCGGA TCAAACGGCC 
GATCTCCTCG ATCCCAAGAG CTGGCATAAA GCACCCACAC CCGTATTTAG CAGTAATCCA 
GCGCTTAAAC GTTTTGGTCC AGGGCACAAC AGCTTTGTAC TGGCAGAAGA CGGTAAGACG 
GAGTTAATGT TCTACCACGC CCGCAATTAC CTTGAACTGC AGGGAACGCC ACTCACCGAC 
GGCAATCGCC ATAGCTATTA TCGCGCGATA TCCTGGTCAG CAGATGGCAT ACCACAGTTT 
GTTAATGAGC TTAGCGATGA ACAAACGCTT GCTAAGTGA

Protein sequence

MDANLAMDKL TSMTRSKPIS YKHGNANRID PKSNRLSALA VSIALSVCMA SPANAVPVIE 
HKAVVHQAID AQKTTSTIQN LPFIARSADP WVIKADDGSY YFIASVPEFD RIELRHAATI 
QGLSQAKPKI IWRKHESGPM SIDIWAPELH KIDGRWYIYY AASDKDLRFH NRMFVLGLNG 
DDPMAGEWQE LGRLKTAHDA FSLDATSFQV GEQRYFIWAQ QDEAKSYNTG LVIAKMVSPT 
QASAQETIIT EPLLNWERLG FKVNEGAAVL IKNGKVFVTY SASATDDRYA IGLLWADQTA 
DLLDPKSWHK APTPVFSSNP ALKRFGPGHN SFVLAEDGKT ELMFYHARNY LELQGTPLTD 
GNRHSYYRAI SWSADGIPQF VNELSDEQTL AK