Gene Ssed_1940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssed_1940
Symbol
ID	5610333
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sediminis HAW-EB3
Kingdom	Bacteria
Replicon accession	NC_009831
Strand	+
Start bp	2339033
End bp	2340037
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	40%
IMG OID	640932826
Product	sugar-binding protein, putative
Protein accession	YP_001473679
Protein GI	157375079
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGATTAT CGATAATACT TTTAGTATTT ACCATGTTGC CACTATTTTC AGCCAGTGGG 
AAAGATCTTA AGTTCGCAGT TGTTCCTAAG TACCACAGTG TTTTTTTTGA ACAGAGCAAA 
CATGGTTGTA AGGATGCAGC CACTCAAATA AAAGGCGTCG AGTGTATATA TCGGGGCCCT 
GAAAAAGCGA GTGTTAGAGT ACAGGATCAG ATTATTTCAC AACTGATCGA TGAGGGGGTT 
GATGGCATCG CTGTAGCCGT TACACAGTCT AAATTCCTCG CAGAAAATAG TATTCAAAAA 
GCACGAAATG CTGGAATACC TATTGTCACT TATGACTCTG ATTTTGACCT TCAAACCTTG 
GAAAAGTATA AAAAGATACG CTCAACTTAT ATAGGGACAG ATAATTTTCA GTTTGGTAGA 
GCTTTAGGGG AACAACTAAA AAAACAGCGC CCCAATGGAG GAACATTAAT TATTCAAACT 
GGACGCCCAG ACTCTCCAAA TTTGAATCTT AGAATTATGG GGATCCGTTC TGCTCTGTCT 
GGCAAACAAT ATAATACTCC TCCCGGGAAA ATGCTCCTAA ATGATAGTGG CTGGACTGAA 
GTAAGAGAGC CTTTTATTAA TTTTGATCAG CTTTCAAGGG CGGTAAAGCA GATGGAGTCA 
GTGGTACAGG GAAGGCGATT AAAAGCGGAC TCCTTTATTG CCGTTGGTGG TTGGCCTCAA 
AATGATGAAG CCCTTTATCG AAAAATGATC GCCCCTTTTA AAGAGAAGCT TGAGCGTAAA 
GAGGTGATAG TTGTTATCTC TGATGCATCA GATCAGCAGT TAATCATGTT ACGAGACCAG 
CTTGCTCATG CCAATGTTGG CCAAAACCCT TATGAGATGG GAAGGCAAGC CATTTTAACC 
CTGCATAATA TTGTAAAAAA TCTAGATTAC GATGAGTTTA TTCATACCCC TATTAATTTG 
TGTACCCGGG AAAACTACAC TAGCTGCACC CAACACAATT TATAA

Protein sequence

MRLSIILLVF TMLPLFSASG KDLKFAVVPK YHSVFFEQSK HGCKDAATQI KGVECIYRGP 
EKASVRVQDQ IISQLIDEGV DGIAVAVTQS KFLAENSIQK ARNAGIPIVT YDSDFDLQTL 
EKYKKIRSTY IGTDNFQFGR ALGEQLKKQR PNGGTLIIQT GRPDSPNLNL RIMGIRSALS 
GKQYNTPPGK MLLNDSGWTE VREPFINFDQ LSRAVKQMES VVQGRRLKAD SFIAVGGWPQ 
NDEALYRKMI APFKEKLERK EVIVVISDAS DQQLIMLRDQ LAHANVGQNP YEMGRQAILT 
LHNIVKNLDY DEFIHTPINL CTRENYTSCT QHNL