Gene EcSMS35_0855 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0855
Symbol	gsiB
ID	6144614
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	861090
End bp	862628
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	52%
IMG OID	641615743
Product	glutathione ABC transporter, periplasmic glutathione-binding protein GsiB
Protein accession	YP_001742935
Protein GI	170680264
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAGAG CTGTACACCG TAGTGGGTTA GTGGCGCTGG GCATTGCGAC AGCGTTGATG 
GCATCTTGTG CATTCGCTGC CAAAGATGTG GTGGTGGCGG TAGGATCGAA CTTCACCACG 
CTCGATCCAT ATGACGCGAA TGACACGTTA TCTCAGGCCG TAGCGAAATC GTTTTACCAG 
GGGCTGTTCG GTCTGGATAA AGAGATGAAA CTGAAAAACG TGCTGGCGGA GAGTTATACC 
GTTTCCGATG ACGGCCTTAC TTACACCGTG AAACTGCGGG AAGGAATTAA ATTCCAGGAT 
GGAACCGACT TCAACGCAGC GGCGGTAAAA GCGAATCTGG ACCGGGCCAG CGATCCGGCG 
AATCATCTTA AACGCTACAA CCTGTATAAG AATATTGCCA AAACGGAAGC GATCGATCCA 
ACAACGGTAA AGATTACCCT CAAACAGCCG TTCTCAGCGT TTATTAATAT TCTTGCCCAT 
CCGGCGACCG CGATGATTTC GCCGGCAGCG CTGGAAAAAT ATGGCAAGGA TATTGGTTTT 
CATCCGGTGG GAACCGGGCC GTATGAACTG GATACCTGGA ATCAGACCGA TTTTGTGAAG 
GTGAAAAAAT TCGCGGGTTA CTGGCAGCCA GGATTGCCCA AACTGGACAG CATAACCTGG 
CGTCCGGTTG CGGATAACAA CACCCGCGCG GCAATGCTAC AAACCGGTGA AGCGCAGTTT 
GCTTTCCCCA TTCCTTACGA GCAGGCCGCA TTGCTGGAGA AAAACAAAAA TATCGAGTTG 
ATGGCCAGTC CGTCAATTAT GCAGCGTTAT ATCAGTATGA ACGTGACGCA AAAGCCGTTC 
GATAACCCGA AGGTCCGTGA GGCGCTGAAT TACGCCATTA ACCGCCCGGC GCTGGTGAAA 
GTGGCCTTCG CGGGCTATGC AACGCCAGCT ACTGGTGTGG TACCGCCGAG TATCGCCTAT 
GCGCAAAGTT ATAAACCGTG GCCTTACGAT CCAGTGAAAG CGCGCGAATT ACTGAAAGAG 
GCGGGATATC CCAACGGTTT CAGTACCACG CTGTGGTCGT CACATAACCA CAGCACCGCG 
CAGAAAGTGC TGCAATTTAC CCAGCAGCAG TTAGCGCAGG TCGGGATTAA AGCCCAGGTG 
ACTGCGATGG ATGCCGGACA GCGGGCGGCA GAAGTCGAAG GTAAAGGGCA AAAAGAGAGC 
GGCGTGCGGA TGTTCTACAC TGGCTGGTCG GCTTCAACCG GCGAAGCTGA CTGGGCACTA 
TCGCCGCTGT TTGCCTCGCA AAACTGGCCA CCAACGCTGT TTAATACCGC GTTTTACAGC 
AATAAACAGG TGGATGACTT CCTGGCTCAG GCACTAAAAA CTAATGATCC GGCGGAAAAG 
ACCCGTTTAT ATAAGGCGGC GCAGGATATC ATCTGGCAAG AGTCGCCGTG GATCCCGCTG 
GTGGTAGAAA AACTGGTGTC GGCACACAGT AAAAACCTGA CCGGTTTTTG GATCATGCCA 
GACACCGGCT TCAGCTTTGA AGACGCAGAT TTGCAATAA

Protein sequence

MARAVHRSGL VALGIATALM ASCAFAAKDV VVAVGSNFTT LDPYDANDTL SQAVAKSFYQ 
GLFGLDKEMK LKNVLAESYT VSDDGLTYTV KLREGIKFQD GTDFNAAAVK ANLDRASDPA 
NHLKRYNLYK NIAKTEAIDP TTVKITLKQP FSAFINILAH PATAMISPAA LEKYGKDIGF 
HPVGTGPYEL DTWNQTDFVK VKKFAGYWQP GLPKLDSITW RPVADNNTRA AMLQTGEAQF 
AFPIPYEQAA LLEKNKNIEL MASPSIMQRY ISMNVTQKPF DNPKVREALN YAINRPALVK 
VAFAGYATPA TGVVPPSIAY AQSYKPWPYD PVKARELLKE AGYPNGFSTT LWSSHNHSTA 
QKVLQFTQQQ LAQVGIKAQV TAMDAGQRAA EVEGKGQKES GVRMFYTGWS ASTGEADWAL 
SPLFASQNWP PTLFNTAFYS NKQVDDFLAQ ALKTNDPAEK TRLYKAAQDI IWQESPWIPL 
VVEKLVSAHS KNLTGFWIMP DTGFSFEDAD LQ