Gene EcSMS35_4848 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4848
Symbol	gntP
ID	6146146
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	4954576
End bp	4955919
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	53%
IMG OID	641619652
Product	fructuronate transporter
Protein accession	YP_001746759
Protein GI	170682985
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG2610] H+/gluconate symporter and related permeases
TIGRFAM ID	[TIGR00791] gluconate transporter

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.774061
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATGTGC TTAACATTCT CTGGGTGGTA TTCGGCATTG GTCTGATGCT GGTACTGAAT 
TTGAAGTTCA AAATCAATTC AATGGTGGCT TTGTTGGTGG CGGCGCTGTC CGTCGGGATG 
CTGGCGGGCA TGGATTTGAT GTCGCTGCTG CACACCATGA AAGCGGGCTT CGGCAACACG 
CTGGGGGAAC TGGCTATCAT CGTGGTGTTC GGTGCGGTCA TCGGTAAATT GATGGTCGAC 
TCCGGCGCGG CTCACCAGAT AGCACATACG CTGCTGGCGC GTCTCGGTCT GCGCTATGTA 
CAGCTGTCGG TGATTATCAT CGGCCTGATT TTCGGTCTGG CGATGTTTTA TGAAGTGGCC 
TTTATCATGT TAGCGCCGCT GGTTATTGTT ATTGCCGCCG AAGCTAAAAT TCCGTTCCTG 
AAACTGGCGA TCCCGGCAGT AGCAGCTGCC ACTACAGCAC ATTCACTGTT CCCACCGCAG 
CCGGGTCCGG TGGCGCTGGT GAATGCTTAT GGCGCGGATA TGGGGATGGT TTATATCTAT 
GGCGTACTGG TGACGATCCC AAGTGTAATC TGCGCAGGTC TGATCCTGCC GAAGTTCCTC 
GGCAATCTTG AGCGCCCAAC GCCATCATTC CTGAAAGCAG ATCAACCGGT AGATATGAAT 
AATCTGCCCT CTTTCGGCGT TTCGATTCTG GTGCCGCTGA TCCCAGCGAT CATTATGATC 
TCCACCACCA TCGCCAATAT CTGGCTGGTA AAAGATACCC CTGCCTGGGA AGTGGTTAAC 
TTTATCGGTT CCTCGCCGAT TGCAATGTTT ATTGCGATGG TGGTTGCATT CGTACTCTTT 
GGCACCGCGC GTGGTCATGA CATGCAGTGG GTGATGAACG CTTTTGAAAG CGCGGTGAAG 
AGTATTGCAA TGGTGATTCT GATCATCGGT GCGGGTGGCG TGCTGAAGCA GACCATCATC 
GACACCGGCA TTGGCGACAC CATCGGCATG TTGATGTCCC ACGGCAATAT CTCGCCCTAC 
ATCATGGCAT GGCTGATCAC TGTGCTAATT CGTCTGGCGA CGGGTCAGGG TGTCGTTTCG 
GCGATGACCG CCGCCGGGAT TATCAGTGCT GCAATCCTTG ATCCAGCAAC CGGTCAGCTG 
GTTGGCGTGA ATCCGGCGCT GCTGGTACTG GCGACGGCTG CGGGTTCCAA CACCCTCACC 
CACATTAATG ATGCCTCATT CTGGCTGTTC AAAGGTTACT TTGACCTGTC GGTAAAAGAC 
ACGTTGAAAA CCTGGGGACT GCTGGAGCTG GTCAACTCCG TGGTTGGGCT GATTATTGTG 
TTGATTATTA GCATGGTAGC GTAA

Protein sequence

MHVLNILWVV FGIGLMLVLN LKFKINSMVA LLVAALSVGM LAGMDLMSLL HTMKAGFGNT 
LGELAIIVVF GAVIGKLMVD SGAAHQIAHT LLARLGLRYV QLSVIIIGLI FGLAMFYEVA 
FIMLAPLVIV IAAEAKIPFL KLAIPAVAAA TTAHSLFPPQ PGPVALVNAY GADMGMVYIY 
GVLVTIPSVI CAGLILPKFL GNLERPTPSF LKADQPVDMN NLPSFGVSIL VPLIPAIIMI 
STTIANIWLV KDTPAWEVVN FIGSSPIAMF IAMVVAFVLF GTARGHDMQW VMNAFESAVK 
SIAMVILIIG AGGVLKQTII DTGIGDTIGM LMSHGNISPY IMAWLITVLI RLATGQGVVS 
AMTAAGIISA AILDPATGQL VGVNPALLVL ATAAGSNTLT HINDASFWLF KGYFDLSVKD 
TLKTWGLLEL VNSVVGLIIV LIISMVA