Gene Sbal223_2004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_2004
Symbol
ID	7086838
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	+
Start bp	2364513
End bp	2365670
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	50%
IMG OID	643460907
Product	Cupin 4 family protein
Protein accession	YP_002357931
Protein GI	217973180
COG category	[S] Function unknown
COG ID	[COG2850] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.367195
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0000511749
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCAACTCG ATATTAACGG CTTAACGCCC GCGCAATTTC TAGCAGAGTA TTGGCAGAAA 
AAACCCTTGG TGATCCGCCA AGGATTCAAG CATTTTCAAG ATTTAGTTTC GCCCGAAGAA 
TTAGCTGGCT TAGCCATGGA TGAGCTGGTG GAATCTCGGC GGGTGTACCA ACAAGCTGGC 
CAATGGCAGG CGGAATTTGG TCCCTTTGAT TCCTACGATC ATCTCGGTGA ACGGGATTGG 
ACTCTGATCG TCCAAGCTTT GAATAACTGG GTGCCCGATG CGGAGGCCTT GATCCAATGC 
TTTGATTTTA TTCCGCGCTG GCGTTTAGAT GATGTGATGG TGAGCTTTGC GACTCCTGGC 
GGTGGAGTAG GCCCGCATAT CGATCTGTAT GATGTGTTTA TTTGCCAAGG TTCGGGACGT 
CGCCGTTGGC GTGTGGGCGA TCTGGGGCCG CACAAAGAGT TTGCCGCCCA TCCCGCTTTG 
CTGCACACAG AAGCCTTTGA ACCGATTATC GATACTGAGT TGTTGCCCGG CGACATCCTT 
TATATTCCCC CCGGATTCCC CCATGACGGC ATAACCTTAG AACAGTCGTT AAGTTTTTCA 
GTGGGTTATC GCACCGCCTC CGCTAAAGAT ATGATAAGTG CTTTGGCCGA TCATTTGTCT 
GAACAGGATT TAGGCGCACA GCAGATTGAA GATCCAGATC GCGAGCTGAC CACCCGCAGT 
GGCTGTGTCG ATAATGGCGA TTTAGCGCGG CTACGTACCC AACTGACCAA TATGTTGACC 
GATGAACTGG TGAGCGAGTT TTCGGGCCGC TATTTAACTC AGTCAAAATG CGCCTTAGAT 
TTACCCGATG AGCCATTGGA CATCACGCAA GACGAAGTGC TCGCTTGGCT CGATGAGCAG 
CCGCTTATTC GCCTCGGCGG GCTGCGCTGT TTGTATTTTG ATATCAATGT GGCACAGGGC 
GTTGTCTATA TTAATGGTGA TAAGTATCAG CTTTCAGCCG AATTGGCCGC AGTGATCCCA 
TTACTATGTG ATAGTAATCA GTTGGATAAA GCTGCCTTAG CCCCTTGGTT AGCCCATGCT 
GATTTGCTCA CGCAACTTAC CGAGTGGGTG AATCTAGGCT ACTGGTACTT TGAAGATCTC 
AGCGATGAAG AGTGTTAA

Protein sequence

MQLDINGLTP AQFLAEYWQK KPLVIRQGFK HFQDLVSPEE LAGLAMDELV ESRRVYQQAG 
QWQAEFGPFD SYDHLGERDW TLIVQALNNW VPDAEALIQC FDFIPRWRLD DVMVSFATPG 
GGVGPHIDLY DVFICQGSGR RRWRVGDLGP HKEFAAHPAL LHTEAFEPII DTELLPGDIL 
YIPPGFPHDG ITLEQSLSFS VGYRTASAKD MISALADHLS EQDLGAQQIE DPDRELTTRS 
GCVDNGDLAR LRTQLTNMLT DELVSEFSGR YLTQSKCALD LPDEPLDITQ DEVLAWLDEQ 
PLIRLGGLRC LYFDINVAQG VVYINGDKYQ LSAELAAVIP LLCDSNQLDK AALAPWLAHA 
DLLTQLTEWV NLGYWYFEDL SDEEC