Gene EcHS_A4521 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4521
Symbol	idnT
ID	5593984
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	4527332
End bp	4528651
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	51%
IMG OID	640923617
Product	Gnt-II system L-idonate transporter
Protein accession	YP_001461058
Protein GI	157163740
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG2610] H+/gluconate symporter and related permeases
TIGRFAM ID	[TIGR00791] gluconate transporter

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.00247449
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCATTAA TCATTATTGC GGCAGGCGTC GCGCTGCTTC TTATCCTGAT GATCGGCTTT 
AAAGTTAACG GCTTTATTGC CCTCGTTCTG GTAGCTGCCG TCGTCGGATT TGCCGAAGGG 
ATGGATGCAC AGGCCGTCCT GCACTCTATA CAAAATGGTA TCGGCAGCAC GCTCGGCGGG 
CTGGCAATGA TTCTCGGTTT CGGGGCCATG TTAGGCAAGC TGATTTCTGA TACGGGTGCG 
GCACAACGTA TCGCCACTAC GCTGATTGCT ACTTTTGGTA AAAAACGCGT GCAATGGGCG 
CTAGTGATCA CCGGTCTGGT TGTGGGCCTC GCCATGTTTT TTGAAGTGGG TTTTGTCCTG 
CTGTTGCCGT TGGTATTTAC CATCGTAGCA TCATCAGGAT TACCCCTGTT GTATGTTGGC 
GTACCAATGG TAGCAGCGCT CTCTGTAACC CACTGTTTTC TGCCGCCACA TCCAGGGCCT 
ACTGCCATCG CGACTATCTT TGAGGCTAAT CTCGGAACGA CTTTACTGTA TGGATTTATC 
ATTACCATTC CGACAGTTAT TGTCGCAGGA CCGCTGTTTT CTAAACTGCT AACTCGCTTT 
GAGAAAGCAC CACCGGAAGG CTTATTTAAT CCTCATCTGT TTAGCGAAGA GGAGATGCCC 
TCCTTCTGGA ACAGTATTTT CGCTGCCGTG ATCCCGGTCA TCCTGATGGC TATCGCCGCC 
GTTTGTGAAA TTACGTTACC GAAAACTAAC ACCGTGCGCC TCTTCTTTGA ATTTGTCGGT 
AACCCTGCCG TTGCGCTGTT TATTGCCATT GTTATTGCGA TTTTCACACT GGGCCGACGT 
AATGGACGCA CCATCGAGCA AATCATGGAT ATCATTGGGG ATTCTATAGG CGCTATCGCG 
ATGATTGTGT TTATTATCGC TGGCGGCGGC GCGTTTAAGC AGGTATTAGT AGATAGCGGT 
GTCGGGCACT ATATTTCACA CTTAATGACC GGAACTACGC TTTCGCCGTT ATTGATGTGC 
TGGACTGTTG CGGCGCTGTT GCGTATCGCT CTGGGCTCTG CCACCGTCGC GGCCATTACC 
ACCGCGGGTG TGGTGTTGCC GATTATCAAC GTTACCCATG CCGATCCCGC TTTAATGGTA 
CTGGCAACCG GTGCGGGCAG CGTGATCGCG TCACACGTAA ACGACCCTGG CTTCTGGCTA 
TTTAAAGGGT ATTTTAATCT GACGGTTGGT GAAACGTTGC GTACCTGGAC GGTGATGGAA 
ACCCTTATTT CTATTATGGG TTTGCTGGGC GTGTTAGCCA TTAACGCCGT ATTGCACTGA

Protein sequence

MPLIIIAAGV ALLLILMIGF KVNGFIALVL VAAVVGFAEG MDAQAVLHSI QNGIGSTLGG 
LAMILGFGAM LGKLISDTGA AQRIATTLIA TFGKKRVQWA LVITGLVVGL AMFFEVGFVL 
LLPLVFTIVA SSGLPLLYVG VPMVAALSVT HCFLPPHPGP TAIATIFEAN LGTTLLYGFI 
ITIPTVIVAG PLFSKLLTRF EKAPPEGLFN PHLFSEEEMP SFWNSIFAAV IPVILMAIAA 
VCEITLPKTN TVRLFFEFVG NPAVALFIAI VIAIFTLGRR NGRTIEQIMD IIGDSIGAIA 
MIVFIIAGGG AFKQVLVDSG VGHYISHLMT GTTLSPLLMC WTVAALLRIA LGSATVAAIT 
TAGVVLPIIN VTHADPALMV LATGAGSVIA SHVNDPGFWL FKGYFNLTVG ETLRTWTVME 
TLISIMGLLG VLAINAVLH