Gene EcSMS35_1677 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1677
Symbol
ID	6146441
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1672795
End bp	1674480
Gene Length	1686 bp
Protein Length	561 aa
Translation table	11
GC content	43%
IMG OID	641616553
Product	inner membrane ABC transporter ATP-binding protein
Protein accession	YP_001743731
Protein GI	170682224
COG category	[R] General function prediction only
COG ID	[COG4178] ABC-type uncharacterized transport system, permease and ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATAACCA TTCCCATTAC GTTTTGTATG TTGATAGCAA AGTATCTCTG TCTGCTGAAG 
CCCTTTTGGC TGCGTAAGAA TAATAAAACT TCAGTGTTGT TAATCATTAT TATCCTCGCC 
ATGATCCTTG GCGTGGTTAA AATTCAGGTC TGGTTAAACG ACTGGAATAA TGATTTTTTC 
AATGCGCTAA GCCAGAAAGA AACTGATAAG CTTTGGCAGC TTGTCCTTTG GTTCCCTGCC 
CTGCTGGGGA TCTTTGTATT AATATCCGTA AACAAAACAT GGTTAATTAA ACTACTGACT 
ATTCGCTGGC GCGAATGGTT AACAGATTAC TACCTTAATC GCTGGTTTGC AGATAAAAAC 
TACTACTTCA CGCAGATCTA CGGCGAGCAT AAAAATACAG ATAACCCTGA CCAACGTATC 
GCTGAAGACA TTCTCTTACT GATCAGCAAA ACGCTCAGTC TTTCATTTGG CTTCATCCAG 
TCACTTAGCA TGCTGATCAC CTTTACCGTT ATTCTTTGGC AAAGCGCGGG TACGCTCTCA 
TTCACTGTTG GTGGAACTGA ATGGAATATC CAGGGGTATA TGGTCTATAC CGTCGTGCTC 
ATTGTGATCG GTGGAACTTT ATTTACCCAT AAGGTTGGTA AACGTATTCG TCCGCTTAAT 
GTGGAAAAAC AACGTAGCGA AGCGACATTT CGAACTAATC TTGTGCAGCA TAATAAGCAG 
GCAGAACTGA TTGCGCTAAG CAATGCTGAG TCTCTACAAC GCCAGGAGTT GAGCGAAAAT 
TTTCATACCA TTAAAGAGAA CTGGCATCGT TTAATGAATC GTCAGCGGTG GCTTGATTAC 
TGGCAGAATA TTTATTCGCG CTCGCTTAGC GTTCTTCCCT ACTTTCTGTT ATTGCCGCAG 
TTTATTAGCG GACAGATCAA TCTGGGCGGA CTGATGAAAT CGCGCCAGGC ATTTATGCTG 
GTATCGAACA ATTTAAGCTG GTTTATTTAT AAATATGATG AACTTGCTGT ACTGGCTGCG 
GTTATCGATC GCTTGTATGA GTTCCATCAA CTCACCGAAC AGCGCCCTAC GAATAAGCCT 
AAAAATTGCC AACATGCGGT ACAAGTGGCT GACGCGAGTA TTCGTACTCC TGATAATAAG 
ATCATATTAG AGAACCTGAA CTTTCATGTT TTGCCAGGCA AATGGCTATT GCTGAAAGGT 
TACTCTGGTA CGGGAAAAAC CACACTGCTT AAAACATTAT CCCACTGCTG GCCGTGGTTT 
AAAGGTGATA TTTCTTCTCC TGCTGACAGT TGGTATGTGT CACAAACACC GTTAATCAAA 
ACCGGCTTAC TGAAAGAGAT TATTTGTAAA GCACTTCCCC TGTCCGTAGA CGATAAATCG 
TTGAGTGAAG TACTGCATCA GGTTGGGCTG GGGAAATTGG CTACGCGTAT TCATGACCAC 
GATCGCTGGG GAGATATTCT TTCCAGCGGC GAAAAACAAC GTATCGCCCT GGCTCGATTA 
ATTTTACGAC GTCCGAAATG GATATTTCTT GACGAAACTA CCTCTCATCT TGAGGAACAA 
GAGGCAATCC GCTTACTGCG TTTAGTGCGA GAAAAACTCC CCACAAGCGG CGTCATTATG 
GTTACACATC AACCCGGTGT CTGGAACCTG GCCGATGATA TTTGTGACAT TAGCGCGGTT 
TTATAA

Protein sequence

MITIPITFCM LIAKYLCLLK PFWLRKNNKT SVLLIIIILA MILGVVKIQV WLNDWNNDFF 
NALSQKETDK LWQLVLWFPA LLGIFVLISV NKTWLIKLLT IRWREWLTDY YLNRWFADKN 
YYFTQIYGEH KNTDNPDQRI AEDILLLISK TLSLSFGFIQ SLSMLITFTV ILWQSAGTLS 
FTVGGTEWNI QGYMVYTVVL IVIGGTLFTH KVGKRIRPLN VEKQRSEATF RTNLVQHNKQ 
AELIALSNAE SLQRQELSEN FHTIKENWHR LMNRQRWLDY WQNIYSRSLS VLPYFLLLPQ 
FISGQINLGG LMKSRQAFML VSNNLSWFIY KYDELAVLAA VIDRLYEFHQ LTEQRPTNKP 
KNCQHAVQVA DASIRTPDNK IILENLNFHV LPGKWLLLKG YSGTGKTTLL KTLSHCWPWF 
KGDISSPADS WYVSQTPLIK TGLLKEIICK ALPLSVDDKS LSEVLHQVGL GKLATRIHDH 
DRWGDILSSG EKQRIALARL ILRRPKWIFL DETTSHLEEQ EAIRLLRLVR EKLPTSGVIM 
VTHQPGVWNL ADDICDISAV L