Gene EcHS_A3877 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3877
Symbol
ID	5592364
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3872038
End bp	3873450
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	47%
IMG OID	640922987
Product	sulfate permease family inorganic anion transporter
Protein accession	YP_001460464
Protein GI	157163146
COG category	[R] General function prediction only
COG ID	[COG2252] Permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	52
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATAATTA TCACTGAACC GTTGTTGTCA TTTGTTTTAC AAAAGCAAGG GATTAAATCT 
CCTCCAATGG ACAAAAAAAT GAATAATGAC AATACCGATT ACGTGAGTAA TGAATCAGGG 
ACGCTTTCGC GATTATTTAA ACTACCTCAG CATGGGACCA CCGTCCGCAC AGAATTGATT 
GCGGGGATGA CCACTTTTTT AACCATGGTG TACATCGTTT TTGTGAACCC GCAAATCCTC 
GGCGCGGCAC AAATGGACCC GAAAGTGGTG TTTGTTACCA CCTGTTTGAT TGCCGGTATC 
GGCAGTATTG CGATGGGGAT ATTTGCTAAC TTACCCGTGG CGCTGGCTCC GGCAATGGGG 
CTGAACGCCT TCTTTGCCTT CGTGGTCGTG GGGGCGATGG GCATCTCCTG GCAGACCGGG 
ATGGGCGCAA TATTCTGGGG CGCAGTTGGA CTATTTTTGC TCACGCTGTT TCGTATCCGG 
TACTGGATGA TCTCCAACAT TCCCTTAAGT TTACGTATTG GTATCACCAG CGGAATTGGA 
TTATTTATCG CCTTAATGGG ATTAAAAAAT ACTGGCGTTA TTGTCGCCAA TAAAGACACG 
CTGGTGATGA TTGGCGATTT AAGTTCTCAC GGCGTGTTGT TAGGTATTTT AGGGTTTTTT 
ATTATAACCG TGTTGTCATC ACGTCATTTT CATGCCGCGG TGCTGGTTTC TATTGTGGTG 
ACGTCTTGCT GTGGATTATT TTTCGGTGAT GTTCATTTTA GCGGCGTCTA TTCCATTCCG 
CCTGATATTA GCGGCGTCAT TGGTGAAGTA GATTTGAGCG GCGCGTTAAC ACTTGAACTC 
GCCGGTATCA TTTTCTCCTT TATGCTGATC AACCTATTTG ATTCATCAGG AACATTAATT 
GGTGTAACTG ATAAAGCGGG CTTAATAGAT GGTAACGGTA AATTCCCCAA TATGAATAAG 
GCGCTGTATG TTGATAGCGT CAGTTCGGTG GCGGGTGCGT TTATCGGCAC CTCGTCTGTT 
ACTGCCTATA TTGAAAGTAC TTCTGGTGTG GCAGTCGGTG GCCGCACGGG GCTGACTGCG 
GTTGTGGTTG GCGTTATGTT CCTGTTGGTT ATGTTCTTCT CACCGCTGGT GGCGATAGTT 
CCTCCTTACG CAACCGCCGG AGCGTTAATC TTTGTTGGCG TGCTGATGAC TTCGAGCCTG 
GCGCGCGTTA ACTGGGATGA TTTTACCGAA TCGGTGCCTG CGTTTATTAC CACGGTGATG 
ATGCCCTTTA CTTTCTCGAT CACCGAAGGG ATTGCACTCG GCTTTATGTC GTACTGCATC 
ATGAAAGTAT GCACCGGGCG CTGGCGCGAT CTGAACCTGT GTGTGGTGGT GGTCGCAGCT 
CTGTTTGCAC TGAAGATTAT TCTGGTGGAT TAG

Protein sequence

MIIITEPLLS FVLQKQGIKS PPMDKKMNND NTDYVSNESG TLSRLFKLPQ HGTTVRTELI 
AGMTTFLTMV YIVFVNPQIL GAAQMDPKVV FVTTCLIAGI GSIAMGIFAN LPVALAPAMG 
LNAFFAFVVV GAMGISWQTG MGAIFWGAVG LFLLTLFRIR YWMISNIPLS LRIGITSGIG 
LFIALMGLKN TGVIVANKDT LVMIGDLSSH GVLLGILGFF IITVLSSRHF HAAVLVSIVV 
TSCCGLFFGD VHFSGVYSIP PDISGVIGEV DLSGALTLEL AGIIFSFMLI NLFDSSGTLI 
GVTDKAGLID GNGKFPNMNK ALYVDSVSSV AGAFIGTSSV TAYIESTSGV AVGGRTGLTA 
VVVGVMFLLV MFFSPLVAIV PPYATAGALI FVGVLMTSSL ARVNWDDFTE SVPAFITTVM 
MPFTFSITEG IALGFMSYCI MKVCTGRWRD LNLCVVVVAA LFALKIILVD