Gene EcSMS35_2478 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2478
Symbol
ID	6147466
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2525807
End bp	2526985
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	57%
IMG OID	641617351
Product	hypothetical protein
Protein accession	YP_001744523
Protein GI	170682781
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGCTG TAAGCCAAAC CGAAACACGA TCTTCTGCCA ATTTTTCGCT CTTCCGCATC 
GCTTTTGCGG TTTTTCTCAC CTACATGACC GTAGGTTTAC CGTTGCCGGT TATCCCGCTG 
TTTGTTCATC ATGAGCTGGG CTATGGCAAC ACCATGGTCG GGATTGCCGT CGGCATTCAG 
TTTTTGGCTA CGGTGCTGAC GCGTGGTTAC GCCGGGCGAC TGGCCGATCA ATATGGCGCA 
AAACGTTCGG CGCTTCAGGG GATGTTAGCT TGTGGTCTGG CGGGGGGCGC ACTGCTGTTG 
GCGGCGATTT TGCCCGTCTC CGCACCGTTC AAATTTGCTC TGTTGGTCGT TGGACGTTTG 
ATTCTTGGCT TTGGTGAAAG CCAGTTACTG ACGGGGGCTC TGACCTGGGG ATTGGGCATC 
GTTGGGCCAA AACATTCCGG CAAAGTGATG TCATGGAACG GAATGGCGAT TTACGGTGCC 
CTCGCTGTTG GTGCGCCGCT TGGCCTGTTG ATTCATAGCC ATTACGGTTT TGCCGCACTG 
GCGCTCACCA CAATGGCATT ACCCTTACTG GCGTGGGCCT GTAACGGCAC AGTGCGCAAA 
GTACCGGCCC TGGCGGGAGA ACGTCCATCG CTGTGGAGCG TTGTCGGGCT TATCTGGAAA 
CCAGGGTTAG GTCTGGCACT ACAAGGCGTT GGTTTTGCGG TTATCGGGAC TTTCGTTTCG 
CTCTACTTTG CCAGCAAAGG ATGGGCGATG GCGGGCTTTA CTCTTACCGC GTTTGGCGGC 
GCATTTGTCG TGATGCGCGT CATGTTTGGC TGGATGCCGG ACCGTTTTGG CGGCGTGAAA 
GTGGCGATCG TCTCTCTGCT TGTAGAAACG GTGGGCTTGT TGCTGCTCTG GCAAGCCCCA 
GGGGCGTGGG TCGCATTAGC AGGCGCGGCG TTAACTGGAG CCGGATGTTC GCTTATCTTT 
CCTGCGCTGG GCGTGGAGGT GGTTAAACGC GTCCCCTCAC ACGTTCGCGG CACCGCACTG 
GGCGGTTACG CCGCGTTTCA GGATATCGCC CTCGGCGTCT CCGGGCCGCT TGCGGGAATG 
CTGGCGACCA CGTTTGGTTA CTCTTCGGTA TTTCTTGCCG GGGCGATCTC TGCGGTGCTG 
GGAATTATTG TCACGATACT GTCGTTTCGT CGGGGTTAA

Protein sequence

MTAVSQTETR SSANFSLFRI AFAVFLTYMT VGLPLPVIPL FVHHELGYGN TMVGIAVGIQ 
FLATVLTRGY AGRLADQYGA KRSALQGMLA CGLAGGALLL AAILPVSAPF KFALLVVGRL 
ILGFGESQLL TGALTWGLGI VGPKHSGKVM SWNGMAIYGA LAVGAPLGLL IHSHYGFAAL 
ALTTMALPLL AWACNGTVRK VPALAGERPS LWSVVGLIWK PGLGLALQGV GFAVIGTFVS 
LYFASKGWAM AGFTLTAFGG AFVVMRVMFG WMPDRFGGVK VAIVSLLVET VGLLLLWQAP 
GAWVALAGAA LTGAGCSLIF PALGVEVVKR VPSHVRGTAL GGYAAFQDIA LGVSGPLAGM 
LATTFGYSSV FLAGAISAVL GIIVTILSFR RG