Gene EcSMS35_2739 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2739
Symbol	kgtP
ID	6146863
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2819492
End bp	2820790
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	49%
IMG OID	641617611
Product	alpha-ketoglutarate transporter
Protein accession	YP_001744776
Protein GI	170682366
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00883] metabolite-proton symporter

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.715904
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	0.945982
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGAAA GTACTGTAAC GGCAGACAGC AAACTGACAA GTAGTGATAC TCGTCGCCGC 
ATTTGGGCGA TTGTGGGGGC CTCTTCAGGT AATCTGGTCG AGTGGTTCGA TTTCTATGTC 
TACTCGTTCT GTTCACTCTA CTTTGCCCAC ATCTTCTTCC CTTCCGGGAA CACGACGACT 
CAACTACTAC AAACAGCAGG TGTTTTTGCT GCGGGATTTC TGATGCGCCC AATAGGCGGT 
TGGCTATTTG GCCGCATAGC CGATAAACAT GGTCGCAAAA AATCGATGCT ATTATCGGTG 
TGTATGATGT GTTTCGGCTC ACTGGTTATC GCCTGTTTGC CAGGCTACGA AACAATCGGT 
ACCTGGGCTC CGGCATTATT GCTTCTTGCT CGTTTATTCC AGGGATTATC CGTTGGCGGA 
GAATATGGCA CCAGCGCCAC CTATATGAGT GAAGTTGCCG TTGAAGGGCG CAAAGGTTTT 
TACGCATCAT TTCAGTATGT GACGTTGATC GGCGGGCAAC TGCTAGCTCT ACTGGTTGTC 
GTGGTTTTAC AACACACCAT GGAAGACGCT GCACTCAGAG AGTGGGGATG GCGTATTCCT 
TTCGCGTTAG GAGCTGTGTT AGCTGTTGTG GCGTTGTGGT TACGTCGTCA GTTAGATGAA 
ACTTCACAAC AAGAAACGCG CGCTTTAAAA GAAGCTGGAT CTCTGAAAGG ATTATGGCGC 
AATCGCCGTG CATTCATCAT GGTTCTCGGT TTTACCGCTG CGGGCTCCCT TTGTTTCTAT 
ACCTTCACCA CTTATATGCA GAAGTATCTG GTAAATACTG CGGGAATGCA TGCCAACGTG 
GCGAGTGGCA TTATGACTGC CGCATTGTTT GTATTCATGC TTATTCAACC ACTCATTGGC 
GCGCTGTCGG ATAAGATTGG TCGCCGTACC TCAATGTTAT GTTTCGGTTC GCTGGCAGCC 
ATTTTTACCG TTCCTATTCT CTCAGCATTG CAGAACGTTT CCTCGCCTTA TGCCGCTTTT 
GGTCTGGTGA TGTGCGCCCT GCTGATAGTG AGTTTTTATA CTTCAATCAG TGGAATACTG 
AAGGCTGAGA TGTTCCCGGC ACAGGTTCGC GCATTAGGCG TTGGTCTGTC ATATGCGGTC 
GCCAATGCTA TATTTGGTGG GTCGGCGGAG TACGTAGCGT TGTCGCTGAA ATCAATAGGA 
ATGGAAACAG CCTTCTTCTG GTATGTGACC TTGATGGCCG TGGTGGCGTT TCTGGTTTCA 
CTAACATTGC ACCGTAAAGG AAAAGGGATG CGGCTTTAG

Protein sequence

MAESTVTADS KLTSSDTRRR IWAIVGASSG NLVEWFDFYV YSFCSLYFAH IFFPSGNTTT 
QLLQTAGVFA AGFLMRPIGG WLFGRIADKH GRKKSMLLSV CMMCFGSLVI ACLPGYETIG 
TWAPALLLLA RLFQGLSVGG EYGTSATYMS EVAVEGRKGF YASFQYVTLI GGQLLALLVV 
VVLQHTMEDA ALREWGWRIP FALGAVLAVV ALWLRRQLDE TSQQETRALK EAGSLKGLWR 
NRRAFIMVLG FTAAGSLCFY TFTTYMQKYL VNTAGMHANV ASGIMTAALF VFMLIQPLIG 
ALSDKIGRRT SMLCFGSLAA IFTVPILSAL QNVSSPYAAF GLVMCALLIV SFYTSISGIL 
KAEMFPAQVR ALGVGLSYAV ANAIFGGSAE YVALSLKSIG METAFFWYVT LMAVVAFLVS 
LTLHRKGKGM RL