Gene EcHS_A3875 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3875
Symbol	nepI
ID	5592362
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3870132
End bp	3871487
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	52%
IMG OID	640922985
Product	ribonucleoside transporter
Protein accession	YP_001460462
Protein GI	157163144
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	66
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGATAAGA CGTTCACGCC GCATCCGGTA ATCTTTGCCC TGTTCCGTTT CGATCTTAAC 
TCCAGCTCAA GCAACACCGT AAAAGTTGCA AAAACGTTAA ATGCGTCACA CATTTCAATG 
TTAAAGTGGT CGGCTTTTCC CCTGAAACAT GCCACGGGTA ACACCATGAG TGAATTTATT 
GCCGAAAACC GCGGCGCGGA TGCCATCACC CGACCGAACT GGTCAGCCGT TTTCTCGGTG 
GCGTTTTGTG TCGCCTGTCT GATTATCGTT GAGTTTTTGC CCGTCAGTTT GTTGACGCCA 
ATGGCCCAGG ATTTAGGCAT TTCGGAAGGG GTTGCCGGGC AATCGGTGAC CGTGACCGCC 
TTTGTGGCAA TGTTTGCCAG TTTGTTTATT ACCCAGACAA TTCAGGCTAC TGACCGCCGC 
TACGTTGTTA TTTTGTTTGC CGTTTTGCTG ACGCTCTCCT GCTTGCTGGT TTCCTTTGCT 
AACTCATTCA GTTTGCTTTT AATCGGTCGT GCCTGTCTGG GGCTGGCGCT GGGCGGGTTC 
TGGGCGATGT CGGCGTCGCT GACCATGCGT CTGGTGCCGC CGCGTACGGT GCCGAAGGCG 
CTGTCGGTGA TCTTCGGCGC GGTTTCTATT GCGCTGGTGA TTGCCGCGCC GTTGGGCAGT 
TTTTTAGGCG AGCTTATCGG TTGGCGCAAT GTCTTTAATG CGGCGGCGGT GATGGGCGTG 
CTGTGTATTT TCTGGATTAT CAAATCATTG CCTTCACTGC CAGGCGAACC CTCGCATCAG 
AAACAAAATA CTTTCCGCTT ATTACAACGT CCGGGTGTGA TGGCAGGGAT GATCGCCATC 
TTCATGTCTT TCGCCGGGCA GTTTGCTTTC TTCACGTATA TTCGCCCGGT GTATATGAAC 
CTGGCGGGAT TCGGCGTGGA TGGCTTAACG CTGGTGCTGT TGAGTTTTGG TATCGCCAGC 
TTTATTGGTA CGTCGCTTTC GTCGTTCATT CTTAAACGTT CGGTAAAACT GGCCTTAGCA 
GGCGCGCCGT TAATACTGGC TGTGAGTGCG TTGGTACTGA CGTTGTGGGG AAGCGATAAA 
ATCGTTGCTA CCGGCGTGGC GATTATCTGG GGGCTAACTT TTGCATTGGT TCCCGTCGGC 
TGGTCAACGT GGATCACCCG CTCGCTGGCC GATCAGGCAG AAAAAGCCGG GTCTATTCAG 
GTGGCGGTTA TTCAGCTTGC TAATACCTGT GGCGCGGCAA TCGGCGGTTA TGCGCTGGAT 
AATATTGGTC TGACTTCGCC GTTGATGTTG TCCGGCACAT TGATGTTGCT GACTGCATTG 
TTGGTTACTG CAAAGGTGAA AATGAAGAAA TCCTGA

Protein sequence

MDKTFTPHPV IFALFRFDLN SSSSNTVKVA KTLNASHISM LKWSAFPLKH ATGNTMSEFI 
AENRGADAIT RPNWSAVFSV AFCVACLIIV EFLPVSLLTP MAQDLGISEG VAGQSVTVTA 
FVAMFASLFI TQTIQATDRR YVVILFAVLL TLSCLLVSFA NSFSLLLIGR ACLGLALGGF 
WAMSASLTMR LVPPRTVPKA LSVIFGAVSI ALVIAAPLGS FLGELIGWRN VFNAAAVMGV 
LCIFWIIKSL PSLPGEPSHQ KQNTFRLLQR PGVMAGMIAI FMSFAGQFAF FTYIRPVYMN 
LAGFGVDGLT LVLLSFGIAS FIGTSLSSFI LKRSVKLALA GAPLILAVSA LVLTLWGSDK 
IVATGVAIIW GLTFALVPVG WSTWITRSLA DQAEKAGSIQ VAVIQLANTC GAAIGGYALD 
NIGLTSPLML SGTLMLLTAL LVTAKVKMKK S