Gene Sbal223_3937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_3937
Symbol
ID	7086700
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	-
Start bp	4689931
End bp	4691247
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	47%
IMG OID	643462813
Product	protein of unknown function DUF21
Protein accession	YP_002359834
Protein GI	217975083
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCTCT TTGATAACGT GATGATTATA TTGTGCCTAA TCGGCGCGAG TTGTTTCTTC 
TCTATGTCAG AAATTGCACT TGCCGCTTCA CGTAAAATCC GTTTACGTCA GTTGGCCGAT 
GAGGGCGATG CCCGTGCAGA AAAAGTGCTG CAGTTACAAG CTGTTCCCGG CAGTTTTTTT 
ACTGTGGTAC AAATCGGTCT TAATGCCGTT GCCATCATGG GCGGTATCGT CGGTGAGTCG 
GCATTTCGGC CTTATTTCTA TGAGTTACTG TCGCCTTTGC TGACCGATCC TTGGTTGAGC 
CAAATGAGCT TTGTTTTATC CTTTATTGTC GTCACCAGTG CCTTTATTCT GGTGGCCGAT 
TTGATGCCAA AACGCATTGC CATGGCGATG CCAGAGCCCG TCGCGTTGGC CGTTGTTGGG 
CCTATGTCTT TCTGTATCGT GCTACTGCGT CCATTAGTGT GGTTTTTCAA TGGCATGGCG 
AGCGGCATCT TTAAACTGCT GCAAATCCCA ACCGTGCGTA ACGATGCCAT CACCTCTGAC 
GACATTTATG CCGTGATGAA CGCGGGCGCC GAAGCAGGGG TATTAGATCG CGGTGATCAA 
CAGATGATGG AAAATGTGTT TGAAATGCAA ACCGTTTCTG TGACTTCGGC CATGACGGCC 
CGTGAAAGCT TAGTGTACTT TTTACTGCAA GATAGCGAAG AAGATATTAA GCGTAAGATT 
TCTGAAGATC CCCACACTAA GTTCCTCGTC TGCGATGGTC AGTTAGATAT GATCAAAGGT 
TTTGTGGATG CAAAAGAGCT GCTGATCCGA GTGATTAACG GTGAGAATAT TACTCTAAAA 
GGCAGTAACT TAGTCCACAC TTCGCTGATC ATTCCTGATA CTTTGAGCCT ATCAGAGGCA 
ATGGAATACT TTAAGAATAG CCGCGCCGAT TTTGCCGTGG TCATGAACGA ATATGCGTTA 
GTGGTGGGGA TTGTTACGAC CAACGATTTG CAGCGCGCGG TAATGGGTGC TTGGTCATTG 
CACGAGAGCG AAGAGCAGAT CATCGCCCGT GATAGCAACT CTTGGTTGGT TGATGGTGTA 
ACGCCGATTA CTGATGTGAT GCGCGCCTTC GGCATCGAAG AATTCCCGCA TAATCAGAAC 
TACGAAACCA TTGCCGGTTT TATGATGTAT ATGCTGCGTA AAATCCCTAA GCGTACCGAT 
TTCGTGAACT ATGCGGGCTA TAAATTTGAG GTGGTCGATA TCGATTCTTA CAAGGTCGAT 
CAGTTGTTGG TGACCCGTAT CGATCCTATC GATAAGCTCA ACTCGCCAGA TGTGTAA

Protein sequence

MSLFDNVMII LCLIGASCFF SMSEIALAAS RKIRLRQLAD EGDARAEKVL QLQAVPGSFF 
TVVQIGLNAV AIMGGIVGES AFRPYFYELL SPLLTDPWLS QMSFVLSFIV VTSAFILVAD 
LMPKRIAMAM PEPVALAVVG PMSFCIVLLR PLVWFFNGMA SGIFKLLQIP TVRNDAITSD 
DIYAVMNAGA EAGVLDRGDQ QMMENVFEMQ TVSVTSAMTA RESLVYFLLQ DSEEDIKRKI 
SEDPHTKFLV CDGQLDMIKG FVDAKELLIR VINGENITLK GSNLVHTSLI IPDTLSLSEA 
MEYFKNSRAD FAVVMNEYAL VVGIVTTNDL QRAVMGAWSL HESEEQIIAR DSNSWLVDGV 
TPITDVMRAF GIEEFPHNQN YETIAGFMMY MLRKIPKRTD FVNYAGYKFE VVDIDSYKVD 
QLLVTRIDPI DKLNSPDV