Gene Sbal223_2156 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_2156
Symbol
ID	7085962
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	+
Start bp	2562069
End bp	2563127
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	46%
IMG OID	643461057
Product	Arabinan endo-1,5-alpha-L-arabinosidase
Protein accession	YP_002358081
Protein GI	217973330
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3507] Beta-xylosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000000116592
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.00999646
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCACCAC TGTCTGTTTC ATCTAAAAAA TACCTTAAGC GGTTCAACTA TGCCTTGATG 
CTCGGCCTTC TTGGCACTGT CGGTAGCGTA AGCGCAAAAC AGGTGAGTAT TCATGATCCG 
GTAATGGCGC AAGAAGCGGG TAACTATTAT CTGTTTAGTA CCGGCCCTGG CATTACCTAT 
TATTCTTCAA AGGATAAAGT GCACTGGGCA TTAGCGGGCA GAGTATTCGA CACTGAGCCC 
ACATGGGCCC GCAGTGTTGC ACCGGGTTTT AATGGTCACC TGTGGGCGCC GGATATCATT 
GAGCAAAACG GCAGTTTTTA CCTTTATTAC TCTGTCTCGG CCTTTGGTAA AAATACCTCC 
GCGATTGGTG TAACCGTCAA TAAAACCCTT GATAAAAAAT CAAAAGATTA TCAGTGGGTT 
GATAAGGGGA TTGTGTTGCA GTCCATTCCC GACCGCGATG CGTGGAATGC TATTGACCCG 
AATATTATTG TTGATGAACA AGGCACGCCT TGGATGAGTT TCGGTTCATT CTGGCAAGGG 
TTGAAGCTCG TTAAACTCAA TAGTGACTTT ATCTCGATTG CCGAGCCGCA GGAATGGCAT 
ACCTTAGCCA AGCTAGCGCG TCCTGCACTG CTAGCAGAAA CCGAACCCGG CCCAGCGCAA 
ATTGAAGCAC CGTTTATTTA TAAAAAAGCG GATTTTTACT ATTTATTTGT TTCCTACGGT 
CTTTGCTGCC GTGGTGACGA CAGTACCTAT CATTTAGCGG TTGGCCGCTC GAAATCAGTG 
ACGGGCCCTT ATCTTGATAA AACCGGTAAA GACATGGCTC AAGGTGGAGG CTCCGTGTTG 
CTTAACGGTA CTAAGGCATG GCCAGGATTG GGGCACAACA GCGTGTATCA ATTTGATGGA 
AAAGATTATT TAGTCTTTCA CGCCTATGAA TCCGCCGATC ACGGCTTACA AAAACTCAAA 
ATAGCTGAAC TGACATGGAA CCAAGGTTGG CCAGTGGTCG ACCCTAACGC GCTCACCCAA 
TATCAAAGTG TATTAGTTGA CTCAGTAGGA AATAAATAA

Protein sequence

MPPLSVSSKK YLKRFNYALM LGLLGTVGSV SAKQVSIHDP VMAQEAGNYY LFSTGPGITY 
YSSKDKVHWA LAGRVFDTEP TWARSVAPGF NGHLWAPDII EQNGSFYLYY SVSAFGKNTS 
AIGVTVNKTL DKKSKDYQWV DKGIVLQSIP DRDAWNAIDP NIIVDEQGTP WMSFGSFWQG 
LKLVKLNSDF ISIAEPQEWH TLAKLARPAL LAETEPGPAQ IEAPFIYKKA DFYYLFVSYG 
LCCRGDDSTY HLAVGRSKSV TGPYLDKTGK DMAQGGGSVL LNGTKAWPGL GHNSVYQFDG 
KDYLVFHAYE SADHGLQKLK IAELTWNQGW PVVDPNALTQ YQSVLVDSVG NK