Gene Sama_2065 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_2065
Symbol
ID	4604315
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	+
Start bp	2501148
End bp	2502266
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	55%
IMG OID	639781442
Product	cupin 4
Protein accession	YP_927940
Protein GI	119775200
COG category	[S] Function unknown
COG ID	[COG2850] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.439804
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATAAGC TCAATCTCGA TATTCAGGCG TTCCTCGCCA ATGACTGGCA ACAGGCCCCA 
AAAGTATTCA AAGGCGCTTT CCCTGACTTT GAAGATCCCA TTGCTGCAGA CGAGCTCGCG 
GGTCTTGCCT GTGAAGAGGA AGTGTCCAGC CGCGTGGTTG TCACCAAGGG TAACGACTGG 
GAAGTCATTT CCGGTCCCTT CGAAGACTAC GACCGGTTTG GTGAGACCCA TTGGCAGCTG 
CTTGTGCAAG CCGTAAACCA CTGGTACCCC GAATCCCAGC CCCTGGTGGA AGCCTTCAGA 
TTCTTGCCAG ACTGGCGCTT TGATGACCTG ATGGTGTCTT TCGCCACCCC GCAGGGCGGC 
GTGGGACCTC ACATCGACAA CTACGATGTG TTTATCATTC AAGGCGAAGG CCAGCGCCGC 
TGGACCGTGG GCCCCAAGGG CAACTACCAG CGCCGCGGTG GTGTAACGAC CTCACCCCTG 
ATTGAAGACT TTGAGCCCAT TATCGATGTC GTGCTGGAAA AAGGTGATGT GCTTTATATC 
CCGCCCGGCT TCCCTCATCA AGGTGAAACC CTGACTCTGG CACTCTCTTA TTCCATGGGG 
TATCGCGCGC CCAGCCAGCA GGAGCTTGCA GGACAAATTG CCGATCAGTT GATGGATGAA 
GACAAGGGGC ACAAGCGCTT TATCGCCGTG GATGGCGCCG CGAGCCATGG CACTGTGAGC 
CTGGCAGAGC AGCAAGGCAT CATGCAGCTT ATCCGCGACC TTTGTAATGA CACCGATAAC 
GTCGTTAAGG TCCTCGGTAA ACTCTTAAGT CAGAACCGCT TCGACCTGGA TATCCAGGAA 
GATGAAAGCA TCGATGCCGA CGCCCTGGTT GAGGCTCTGA ATGAAGGGGC TGTGCTGATG 
CGGATTGGTG GCCTTAAGGT GCTCAAAATG GAAGGCGACA GCCAGGCAAG GCTCTTTGTG 
GCAGGCGAGA GTGTGATAAT TGAAGGCGCT TCGGAAGAAG AGCTGATCGA GGTATCCAAC 
TCAGTCAACG TCAATGCTGA GCTGGCGCAG CTGCCACACT GGCAGGGCTT CTTTGTTCAG 
ATGCTGCAAA AAGGCTATTT CTATCTCGGC GAAGACTGA

Protein sequence

MYKLNLDIQA FLANDWQQAP KVFKGAFPDF EDPIAADELA GLACEEEVSS RVVVTKGNDW 
EVISGPFEDY DRFGETHWQL LVQAVNHWYP ESQPLVEAFR FLPDWRFDDL MVSFATPQGG 
VGPHIDNYDV FIIQGEGQRR WTVGPKGNYQ RRGGVTTSPL IEDFEPIIDV VLEKGDVLYI 
PPGFPHQGET LTLALSYSMG YRAPSQQELA GQIADQLMDE DKGHKRFIAV DGAASHGTVS 
LAEQQGIMQL IRDLCNDTDN VVKVLGKLLS QNRFDLDIQE DESIDADALV EALNEGAVLM 
RIGGLKVLKM EGDSQARLFV AGESVIIEGA SEEELIEVSN SVNVNAELAQ LPHWQGFFVQ 
MLQKGYFYLG ED