Gene Sama_2209 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_2209
Symbol
ID	4604459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	+
Start bp	2670054
End bp	2671073
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	53%
IMG OID	639781606
Product	C4-dicarboxylate-binding periplasmic protein
Protein accession	YP_928084
Protein GI	119775344
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID	[TIGR00787] tripartite ATP-independent periplasmic transporter solute receptor, DctP family

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.160504
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTAT CAAAACCAGC GACCCTGCAA TCTCTCTTTA CCCTAGGCAA AGCCAGCCTG 
CTGGCAACCG TGCTGGGATT CAGCTTCGGT GCAGTCGCCG AACCGGTAGA AATCAAGTTC 
TCCCACGTGG TAGCGGAAAA CACCCCCAAA GGCCAAATGG CGCTCAAGTT TAAAGAGTTG 
GTGGAAAGCC GTCTTCCCGG TGAATATAAG GTGAGTGTAT TTCCCAACTC ACAGCTCTTT 
GGTGACAACA ACGAACTGGC GGCACTGCTG CTGAACGATG TACAGCTGGT AGCGCCATCC 
CTGTCCAAGT TCGAGCGCTA TACCAAAAAA CTGCAGGTAT TCGATCTGCC CTTCCTGTTT 
GAAGACATGG ATGCGGTGGA CCGCTTCCAA CAGAGTGAAG CTGGCCAGCA ACTGCTGAAC 
TCTATGAGCC GCAAAGGCCT GGTTGGTTTG GGCTATCTGC ACAATGGGAT GAAGCAGTTT 
TCGGCCAACA ATGCCCTGTC ACTGCCAGGC GACGCCGCCG GTAAGAAATT CCGCATCATG 
CCTTCCGATG TGATTGCAGC GCAGTTTGAG GCCGTGGGTG CCATCCCGGT GAAAAAGCCG 
TTCTCCGAAG TCTTTACCCT GCTGCAGACC CGCGCCATCG ATGGCCAGGA AAACACCTGG 
TCCAATATCT ATTCCAAGAA GTTTTATGAA GTACAGACTC ACATTACCGA GAGCAATCAC 
GGCGTACTCG ACTATATGTT GGTCACCTCT GAAACCTTCT GGAAGAGTCT GCCCAAGGAC 
AAACGCGAAA TCATCAAGCA GTCCATGGAC GAAGCCGTTG CCCTTGGGAA CAAACTGGCT 
CTGGAAAAAG CCAACGAAGA TCGTCAGCTC ATCCTCGACT CCAAGCGTGT TGAGCTGGTG 
ACCCTGACCC CCGAGCAGCG CCAGGCCTGG GTTAATGCCA TGCGTCCTGT CTGGTCACAG 
TTTGAAGACA AGATTGGTAA AGACCTGATT GAAGCCGCCG AGTCTGCCAA CAAGCCGTAA

Protein sequence

MKVSKPATLQ SLFTLGKASL LATVLGFSFG AVAEPVEIKF SHVVAENTPK GQMALKFKEL 
VESRLPGEYK VSVFPNSQLF GDNNELAALL LNDVQLVAPS LSKFERYTKK LQVFDLPFLF 
EDMDAVDRFQ QSEAGQQLLN SMSRKGLVGL GYLHNGMKQF SANNALSLPG DAAGKKFRIM 
PSDVIAAQFE AVGAIPVKKP FSEVFTLLQT RAIDGQENTW SNIYSKKFYE VQTHITESNH 
GVLDYMLVTS ETFWKSLPKD KREIIKQSMD EAVALGNKLA LEKANEDRQL ILDSKRVELV 
TLTPEQRQAW VNAMRPVWSQ FEDKIGKDLI EAAESANKP