Gene EcSMS35_2372 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2372
Symbol
ID	6146244
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	2408353
End bp	2409675
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	53%
IMG OID	641617245
Product	putative short chain fatty acid transporter
Protein accession	YP_001744417
Protein GI	170682719
COG category	[I] Lipid transport and metabolism
COG ID	[COG2031] Short chain fatty acids transporter
TIGRFAM ID	[TIGR00366] conserved hypothetical integral membrane protein

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.608941
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGGTC GCATATCGCG TTTTATGACG CGTTTTGTCA GCCGGTGGCT TCCCGATCCA 
CTGATCTTTG CCATGTTGCT GACATTGCTA ACATTCGTGA TCGCGCTTTG GTTAACACCA 
CAAACGCCGA TCAGCATGGT GAAAATGTGG GGTGACGGTT TCTGGAACTT GCTGGCGTTT 
GGTATGCAGA TGGCGCTTAT CATCGTTACC GGTCATGCCC TTGCCAGCTC TGCTCCGGTA 
AAAAGTTTGC TGCGTACTGC CGCCTCCGCC GCAAAGACGC CCGTACAGGG CGTCATGCTG 
GTTACTTTCT TCGGTTCAGT CGCTTGTGTC ATCAACTGGG GATTTGGTTT GGTTGTCGGC 
GCAATGTTTG CCCGTGAAGT CGCCCGCCGA GTACCCGGTT CTGATTATCC GTTGCTCATT 
GCCTGCGCCT ACATTGGTTT TCTCACCTGG GGTGGCGGTT TCTCTGGCTC AATGCCTCTG 
TTGGCTGCAA CACCGGGCAA CCCGGTTGAG CATATCGCCG GGCTGATCCC GGTGGGCGAT 
ACTCTGTTCA GTGGTTTTAA CATTTTCATC ACTGTGGCGT TGATTGTGGT GATGCCATTT 
ATCACCCGCA TGATGATGCC AAAACCGTCT GACGTGGTGA GTATCGATCC GAAACTACTC 
ATGGAAGAGG CTGATTTCCA AAAGCAGCTA CCGAAAGATG CCCCACCATC CGAGCGACTG 
GAAGAAAGCC GCATTCTGAC GTTGATCATC GGCGCACTCG GTATCGCTTA CCTTGCGATG 
TACTTCAGCG AACATGGCTT CAACATCACC ATCAATACCG TCAACCTGAT GTTTATGATT 
GCGGGTCTGC TGCTACATAA AACGCCAATG GCTTATATGC GTGCTATCAG CGCGGCAGCA 
CGGAGTACTG CCGGTATTCT GGTGCAATTC CCCTTCTACG CTGGGATCCA ACTGATGATG 
GAGCATTCCG GTCTGGGCGG ACTCATTACC GAATTCTTCA TCAATGTTGC GAACAAAGAC 
ACCTTCCCGG TAATGACCTT TTTTAGTTCT GCACTGATTA ACTTCGCCGT TCCGTCTGGC 
GGCGGTCACT GGGTTATTCA GGGACCTTTC GTGATACCCG CAGCCCAGGC GCTGGGCGCT 
GATCTCGGTA AATCGGTAAT GGCGATCGCC TACGGCGAGC AATGGATGAA CATGGCACAA 
CCGTTCTGGG CGCTGCCAGC ACTGGCAATC GCCGGACTCG GTGTCCGCGA CATCATGGGC 
TATTGCATCA CTGCCCTGCT CTTCTCCGGC GTCATTTTCG TCATTGGTTT AACGCTGTTC 
TGA

Protein sequence

MIGRISRFMT RFVSRWLPDP LIFAMLLTLL TFVIALWLTP QTPISMVKMW GDGFWNLLAF 
GMQMALIIVT GHALASSAPV KSLLRTAASA AKTPVQGVML VTFFGSVACV INWGFGLVVG 
AMFAREVARR VPGSDYPLLI ACAYIGFLTW GGGFSGSMPL LAATPGNPVE HIAGLIPVGD 
TLFSGFNIFI TVALIVVMPF ITRMMMPKPS DVVSIDPKLL MEEADFQKQL PKDAPPSERL 
EESRILTLII GALGIAYLAM YFSEHGFNIT INTVNLMFMI AGLLLHKTPM AYMRAISAAA 
RSTAGILVQF PFYAGIQLMM EHSGLGGLIT EFFINVANKD TFPVMTFFSS ALINFAVPSG 
GGHWVIQGPF VIPAAQALGA DLGKSVMAIA YGEQWMNMAQ PFWALPALAI AGLGVRDIMG 
YCITALLFSG VIFVIGLTLF