Gene EcHS_A0887 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0887
Symbol	gsiA
ID	5594813
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	895402
End bp	897273
Gene Length	1872 bp
Protein Length	623 aa
Translation table	11
GC content	54%
IMG OID	640920059
Product	glutathione transporter ATP-binding protein
Protein accession	YP_001457626
Protein GI	157160308
COG category	[R] General function prediction only
COG ID	[COG1123] ATPase components of various ABC-type transport systems, contain duplicated ATPase
TIGRFAM ID	[TIGR02323] phosphonate C-P lyase system protein PhnK

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCCACACA GTGATGAACT TGATGCCGGT GATGTGCTGG CGGTTGAAAA TCTGAAAATT 
GCCTTTATGC AGGACCAGCA GAAAATAGCT GCGGTCCGCA ATCTCTCTTT TAGCCTTCAA 
CGCGGTGAGA CGCTGGCCAT TGTTGGCGAA TCCGGCTCCG GTAAGTCAGT GACTGCGCTG 
GCATTGATGC GTCTGTTGGA ACAGGCGGGC GGTTTAGTAC AGTGCGATAA AATGCTGTTG 
CGGCGGCGCA GTCGTGAAGT GATTGAACTT AGCGAGCAGA GCGCTGCACA AATGCGCCAT 
GTGCGCGGTG CGGATATGGC GATGATATTT CAGGAGCCGA TGACATCGCT GAACCCGGTA 
TTTACTGTGG GTGAACAGAT TGCCGAATCA ATTCGTCTGC ATCAGAACGC CAGTCGTGAA 
GAAGCGATGG TCGAGGCGAA GCGGATGCTG GATCAGGTAC GCATTCCGGA GGCACAAACC 
ATTCTTTCAC GTTATCCGCA TCAACTCTCT GGCGGGATGC GCCAGCGAGT GATGATTGCG 
ATGGCGCTGT CATGCCGCCC GGCGGTGCTG ATTGCCGATG AGCCAACCAC CGCGCTGGAT 
GTCACTATTC AGGCGCAGAT CCTGCAATTA ATCAAAGTAT TGCAAAAAGA GATGTCGATG 
GGCGTTATCT TTATCACTCA CGATATGGGC GTGGTGGCAG AGATTGCCGA TCGGGTACTG 
GTGATGTATC AGGGCGAGGC GGTGGAAACG GGTACCGTCG AACAGATTTT TCATGCACCG 
CAACATCCTT ACACCCGTGC GCTGTTAGCT GCTGTTCCGC AACTTGGTGC GATGAAAGGG 
TTAGATTATC CCCGACGTTT CCCATTGATA TCGCTTGAAC ATCCAGCGAA ACAGGAACCC 
CCCATCGAGC AGAAAACGGT GGTGGATGGC GAACCTGTTT TACGGGTGCG TAATCTTGTC 
ACCCGTTTCC CTTTGCGCAG CGGTTTGTTG AATCGCGTAA CGCGGGAAGT GCATGCCGTT 
GAGAAAGTCA GTTTTGATCT CTGGCCTGGC GAAACGCTAT CGCTGGTGGG CGAGTCTGGC 
AGCGGTAAAT CCACTACCGG GCGGGCGTTG CTGCGCCTGG TCGAATCGCA GGGCGGCGAA 
ATTATCTTTA ACGGTCAGCG AATCGATACC TTGTCACCCG GCAAACTTCA GGCATTACGC 
CGGGATATTC AGTTTATTTT TCAGGACCCT TACGCTTCGC TGGACCCACG TCAGACCATC 
GGTGATTCGA TTATCGAACC GCTGCGCGTA CACGGTTTAT TGCCAGGTAA AGACGCGGCT 
GCACGCGTTG CGTGGTTGCT GGAGCGCGTG GGCCTGTTAC CTGAACATGC CTGGCGTTAC 
CCGCATGAGT TTTCCGGCGG TCAGCGCCAG CGCATCTGCA TTGCTCGCGC GTTGGCATTG 
AATCCAAAAG TGATCATTGC CGACGAAGCC GTTTCGGCGC TGGATGTTTC TATTCGCGGG 
CAGATTATCA ACTTGTTGCT CGATCTCCAG CGTGATTTCG GCATTGCGTA TCTGTTTATC 
TCCCACGATA TGGCCGTGGT AGAGCGGATT AGTCATCGTG TGGCGGTGAT GTATCTCGGG 
CAAATTGTTG AAATTGGCCC ACGGCGCGCG GTCTTCGAAA ACCCGCAGCA TCCTTATACG 
CGTAAATTAC TGGCGGCAGT TCCGGTCGCT GAACCGTCCC GACAACGACC GCAGCGTGTA 
CTGCTGTCGG ACGATCTTCC CAGCAATATT CATCTGCGTG GCGAAGAGGT GGCAGGCGTC 
TCGTTGCAAT GCGTCGGGCC GGGGCATTAC GTCGCACAAC CACAATCAGA ATACGCATTC 
ATGCGTAGAT AA

Protein sequence

MPHSDELDAG DVLAVENLKI AFMQDQQKIA AVRNLSFSLQ RGETLAIVGE SGSGKSVTAL 
ALMRLLEQAG GLVQCDKMLL RRRSREVIEL SEQSAAQMRH VRGADMAMIF QEPMTSLNPV 
FTVGEQIAES IRLHQNASRE EAMVEAKRML DQVRIPEAQT ILSRYPHQLS GGMRQRVMIA 
MALSCRPAVL IADEPTTALD VTIQAQILQL IKVLQKEMSM GVIFITHDMG VVAEIADRVL 
VMYQGEAVET GTVEQIFHAP QHPYTRALLA AVPQLGAMKG LDYPRRFPLI SLEHPAKQEP 
PIEQKTVVDG EPVLRVRNLV TRFPLRSGLL NRVTREVHAV EKVSFDLWPG ETLSLVGESG 
SGKSTTGRAL LRLVESQGGE IIFNGQRIDT LSPGKLQALR RDIQFIFQDP YASLDPRQTI 
GDSIIEPLRV HGLLPGKDAA ARVAWLLERV GLLPEHAWRY PHEFSGGQRQ RICIARALAL 
NPKVIIADEA VSALDVSIRG QIINLLLDLQ RDFGIAYLFI SHDMAVVERI SHRVAVMYLG 
QIVEIGPRRA VFENPQHPYT RKLLAAVPVA EPSRQRPQRV LLSDDLPSNI HLRGEEVAGV 
SLQCVGPGHY VAQPQSEYAF MRR