Gene Sama_3284 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_3284
Symbol
ID	4605531
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	-
Start bp	3901708
End bp	3903018
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	53%
IMG OID	639782704
Product	hemolysin, putative
Protein accession	YP_929156
Protein GI	119776416
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTTCT TCGAAAATAG TTTGATTATT CTGATGCTTA TCGGCATCAG TTGTTTTTTT 
TCCATGTCGG AAATCGCCCT GGCGGCCTCC CGTAAAATTC GGCTGCGACA GTTGGCCGAT 
GAAGGCAATG AGCGGGCCCG AAAAGTACTT GAGCTGCAGG CTCATCCCGG CAGCTTCTTT 
ACCGTGGTGC AAATAGGCCT CAATGCGGTG GCCATCATGG GCGGTATCGT GGGGGAGTCG 
GCTTTTACCC CCCATATCAT GGCCTTGCTG GATGGTATAG TGCCAGCTAA GTGGCTGGGC 
CAGTTCAGTT TTATCTTGTC TTTTATGCTG GTGACCAGCC TGTTTATTTT GCTGGCAGAT 
CTAATGCCAA AGCGTATCGC CATGGCTATG CCAGAGCGTG TTGCTGTGTC ATTGGTGGGG 
GCCATGGGCC TGTGCATTAC CGTGCTGCGC CCCCTGGTGT GGGTGTTCAA TGGCCTCGCC 
AATGGTTTGT TCCGTATGCT GCGGATCCCC ACAGAGCGTA ACGATGCCAT CACAGAGGAT 
GACATTTACG CGGTGATGGA TGCCGGTGCT GAAGCCGGTG TTATCGACAA GGGCGAACAG 
CAGATGATGG AGAACGTGTT TGAAATGCAA AGCGTTCCTG TGACCTCAGC CATGACACCA 
AGGGAAAGCC TGGTGTTCTT TCTGCAAAGC GACACCGAAG AAGACATCAA GCGTAAAATC 
GCCGCCGACC CCCACAGCCA GTTTCTGCTC TGTGATGGCC AGCTGGATGC CATCAAGGGC 
TATGTGGACT CCAAGGATTT GCTTATCAAG GTGATAAGCG GTCAGGCATT AAACCTGAAA 
GACCCATCAC TGGTACAAAC CTGCCCCATT ATCCCGGATA CCCTGAGCCT GTCTGAGGCG 
CTGGATTACT TCCGTAACAA CAGGGTCGAC TTTGCAGTTG TGCTCAATGA GTATGCGTTG 
GTGCTGGGGG TGGTGACCTT TAACGATCTG CAAAGCGCTG TGATGGGGAC CTGGTCGCTG 
GCCGAAGGTG AAGAACAAAT TGTGGCCCGG GATCCTTCGT CCTGGCTGGT GGATGGGGTA 
ACGCCTATTA CCGATGTGAT GCGTGCCTTT GGCATCGACA GTTTTCCCCA GAGCCAGAAC 
TATGAAACCA TCGCAGGTTT CATTATGTTT ATGCTGCGTA AAATCCCCCG CCGTACCGAC 
TTTGTGGTCT ATGCCGGTTA CAAATTTGAA GTGGTCGATA TCGACTCATA CAAGGTGGAT 
CAGCTGCTGG TGACCAAGGT GGAGTTGCCA CCCGGTGCTG AGGATCAGTA A

Protein sequence

MSFFENSLII LMLIGISCFF SMSEIALAAS RKIRLRQLAD EGNERARKVL ELQAHPGSFF 
TVVQIGLNAV AIMGGIVGES AFTPHIMALL DGIVPAKWLG QFSFILSFML VTSLFILLAD 
LMPKRIAMAM PERVAVSLVG AMGLCITVLR PLVWVFNGLA NGLFRMLRIP TERNDAITED 
DIYAVMDAGA EAGVIDKGEQ QMMENVFEMQ SVPVTSAMTP RESLVFFLQS DTEEDIKRKI 
AADPHSQFLL CDGQLDAIKG YVDSKDLLIK VISGQALNLK DPSLVQTCPI IPDTLSLSEA 
LDYFRNNRVD FAVVLNEYAL VLGVVTFNDL QSAVMGTWSL AEGEEQIVAR DPSSWLVDGV 
TPITDVMRAF GIDSFPQSQN YETIAGFIMF MLRKIPRRTD FVVYAGYKFE VVDIDSYKVD 
QLLVTKVELP PGAEDQ