Gene EcHS_A3896 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3896
Symbol
ID	5591342
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3891783
End bp	3893444
Gene Length	1662 bp
Protein Length	553 aa
Translation table	11
GC content	53%
IMG OID	640923004
Product	hypothetical protein
Protein accession	YP_001460481
Protein GI	157163163
COG category	[R] General function prediction only
COG ID	[COG2985] Predicted permease
TIGRFAM ID	[TIGR01625] AspT/YidE/YbjL antiporter duplication domain

Plasmid Coverage information

Num covering plasmid clones	73
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGATA TAGCATTAAC GGTCAGTATT CTGGCTTTGG TGGCAGTCGT CGGTTTGTTT 
ATCGGCAACG TCAAATTTCG CGGCATAGGA TTAGGTATTG GCGGCGTGCT GTTTGGTGGG 
ATCATCGTCG GCCATTTTGT TTCTCAGGCG GGAATGACAT TAAGTAGCGA TATGCTGCAT 
GTTATTCAGG AATTTGGCCT GATCCTGTTC GTTTATACCA TCGGGATTCA GGTGGGTCCG 
GGCTTCTTTG CCTCATTGCG CGTCTCCGGA TTACGCCTCA ACCTGTTTGC TGTTCTGATC 
GTCATCATCG GTGGTCTGGT TACCGCCATC CTGCATAAAC TGTTTGATAT TCCACTGCCG 
GTAGTGCTGG GGATTTTCTC CGGTGCGGTA ACCAATACGC CAGCGCTGGG GGCAGGGCAG 
CAGATCTTGC GCGACCTGGG TACACCAATG GAAATGGTCG ATCAGATGGG GATGAGTTAT 
GCGATGGCGT ATCCATTCGG CATTTGCGGG ATATTGTTCA CCATGTGGAT GTTGCGGGTT 
ATTTTCCGCG TCAATGTCGA GACAGAAGCC CAGCAGCACG AGTCTTCACG CACCAATGGC 
GGCGCGCTGA TCAGGACTAT CAATATTCGC GTTGAGAACC CTAACCTGCA TGATTTAGCC 
ATTAAAGATG TACCTATTCT CAACGGCGAC AAAATTATCT GCTCGCGTCT GAAACGTGAA 
GAAACCCTAA AAGTTCCTTC GCCAGATACC ATTATCCAAC TGGGCGATTT GCTGCATCTG 
GTGGGGCAGC CAGCGGATTT ACATAATGCG CAACTGGTGA TTGGTCAGGA GGTCGATACC 
TCGCTGTCTA CGAAAGGCAC TGATTTGCGC GTCGAGCGTG TGGTGGTCAC CAATGAAAAC 
GTGCTCGGAA AACGTATTCG CGACCTGCAC TTTAAAGAAC GCTATGACGT TGTTATCTCG 
CGCCTGAACC GTGCCGGGGT CGAACTGGTC GCCAGTGGCG ATATCAGCCT GCAGTTCGGC 
GATATTCTCA ACCTGGTGGG GCGTCCGTCC GCAATTGATG CCGTTGCCAA TGTGCTGGGG 
AATGCGCAGC AAAAACTGCA ACAGGTTCAG ATGTTGCCGG TGTTTATTGG TATCGGGCTT 
GGCGTATTGT TAGGCTCTAT TCCCGTCTTT GTGCCGGGAT TCCCGGCCGC GTTGAAACTG 
GGGCTGGCGG GCGGTCCGCT GATTATGGCG TTGATCCTCG GGCGTATCGG CAGTATTGGC 
AAGCTGTACT GGTTTATGCC GCCAAGTGCC AACCTCGCGC TGCGGGAGCT GGGGATCGTG 
CTGTTCCTCT CGGTCGTTGG TCTGAAATCT GGTGGGGATT TTGTGAATAC CCTGGTCAAT 
GGCGAAGGGC TAAGCTGGAT TGGTTATGGT GCCCTGATCA CCGCCGTTCC GCTGATTACT 
GTTGGTATTC TGGCGCGGAT GTTAGCCAAA ATGAATTACC TGACCATGTG CGGGATGCTG 
GCTGGCTCCA TGACCGATCC ACCGGCGCTG GCATTTGCTA ATAATCTTCA TCCAACCAGC 
GGTGCAGCGG CGCTCTCTTA CGCCACTGTC TATCCGTTAG TGATGTTCCT GCGCATTATC 
ACCCCCCAAT TACTGGCGGT GCTCTTCTGG AGTATCGGTT AA

Protein sequence

MSDIALTVSI LALVAVVGLF IGNVKFRGIG LGIGGVLFGG IIVGHFVSQA GMTLSSDMLH 
VIQEFGLILF VYTIGIQVGP GFFASLRVSG LRLNLFAVLI VIIGGLVTAI LHKLFDIPLP 
VVLGIFSGAV TNTPALGAGQ QILRDLGTPM EMVDQMGMSY AMAYPFGICG ILFTMWMLRV 
IFRVNVETEA QQHESSRTNG GALIRTINIR VENPNLHDLA IKDVPILNGD KIICSRLKRE 
ETLKVPSPDT IIQLGDLLHL VGQPADLHNA QLVIGQEVDT SLSTKGTDLR VERVVVTNEN 
VLGKRIRDLH FKERYDVVIS RLNRAGVELV ASGDISLQFG DILNLVGRPS AIDAVANVLG 
NAQQKLQQVQ MLPVFIGIGL GVLLGSIPVF VPGFPAALKL GLAGGPLIMA LILGRIGSIG 
KLYWFMPPSA NLALRELGIV LFLSVVGLKS GGDFVNTLVN GEGLSWIGYG ALITAVPLIT 
VGILARMLAK MNYLTMCGML AGSMTDPPAL AFANNLHPTS GAAALSYATV YPLVMFLRII 
TPQLLAVLFW SIG