Gene Sama_2044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_2044
Symbol
ID	4604294
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	-
Start bp	2480486
End bp	2481460
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	54%
IMG OID	639781421
Product	hypothetical protein
Protein accession	YP_927919
Protein GI	119775179
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.47923
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCTGA CTTTGCTCGG CGCCGCTACG GCGTTATGGG GTATGAAAGA GCTTGAAACC 
TTTGCCAACA GGCCTCTGAT GCTTGAGCAG GCGAGGGAGC TGGAACTCAA TCGGGGAACC 
AATGCCCGCG CATTGGGCAA AGAGTTGGTT GAGCAGGGAC TCCTTGAAGG CTCATGGCAT 
TACGATTGGT ATCTGCGATT AAATCCCGCC ATGGCGGGCA TTCGTCAGGG GTTGTACGAA 
ATCACCCCAG GCGACACGGT CAAGTCACTG CTTGAAAAGC TCATCAGCGG TAAAGTGAAG 
GACTTCGCAA TCACTTTGGT TGAAGGCCAA ACGCTGCGGG AATGGCAGGC TAAGCTGGAA 
ACTGCCCCCA GGCTGAATTG GGACGCGGAT GTTTTCCATA AGGTTCTCAA GGCGAACGGT 
GATGATTCCG GATTGCCGGA AGGGAAATTT TTTCCCGATA CCTACAGCTA TCCTGCCAAC 
CAGGATGTGG AAACGCTGCT TACCCAGAGC TACCTGAAGA TGCAGCAAGA GCTGGCAGCG 
GCCTGGCAGG TCAGAGCTCC CGATTTACCT CTGGCGAGCG CCTATGAGCT GCTTATCCTG 
GCGTCCATTA TAGAGAAAGA GACCGGCAAG GCCGAGGAGC GCCCCTTGAT TGCTGCGGTG 
TTTATCAACC GGCTGCGAAA GGGAATGCGA CTGCAGACAG ACCCCACGGT GATTTATGGC 
ATGGGAACGC GCTTTAACGG CAATATCACC CGTAAAGATC TGCGTGAGGA TACGCCCTTC 
AACACCTATC GCATTCAAGG ACTGCCACCT ACGCCTATTG CGGCACCCGG ACGTGAAGCC 
TTGATGGCGG CGGCACAACC GGCACAATCA GATTATCTTT ACTTTGTGTC CAGAAACGAT 
GGCAGCCACG TATTTTCCCG CACACTCGCT GAACACAATC GCGCAGTAAA CCAATTTCAG 
AGAAAACAAA AATGA

Protein sequence

MSLTLLGAAT ALWGMKELET FANRPLMLEQ ARELELNRGT NARALGKELV EQGLLEGSWH 
YDWYLRLNPA MAGIRQGLYE ITPGDTVKSL LEKLISGKVK DFAITLVEGQ TLREWQAKLE 
TAPRLNWDAD VFHKVLKANG DDSGLPEGKF FPDTYSYPAN QDVETLLTQS YLKMQQELAA 
AWQVRAPDLP LASAYELLIL ASIIEKETGK AEERPLIAAV FINRLRKGMR LQTDPTVIYG 
MGTRFNGNIT RKDLREDTPF NTYRIQGLPP TPIAAPGREA LMAAAQPAQS DYLYFVSRND 
GSHVFSRTLA EHNRAVNQFQ RKQK