Gene EcHS_A0442 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0442
Symbol	smbA
ID	5593531
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	460536
End bp	461756
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	51%
IMG OID	640919627
Product	transport protein
Protein accession	YP_001457212
Protein GI	157159894
COG category	[I] Lipid transport and metabolism
COG ID	[COG1133] ABC-type long-chain fatty acid transport system, fused permease and ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	49
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTAAGT CTTTTTTCCC AAAGCCGGGA GCGTTTTTTC TCTCGGCCTT TGTTTGGGCA 
TTGATTGCCG TTATCTTCTG GCAAGCCGGT GGGGGAGAGT GGGTGGCGCG TATCACTGGC 
GCTTCCGGGC AGATCCCGAT TAGCGCCGCG CGTTTCTGGT CGTTGGATTT CCTGATTTTT 
TACGCTTACT ACATTGTTTG CGTAGGACTT TTTGCATTTT TCTGGTTTAT CTACAGCCCG 
CACCGTTGGC AATACTGGTC AATACTCGGT ACTGCACTGA TCATCTTCGT CACCTGGTTT 
TTGGTGGAAG TCGGGGTCGC CGTCAACGCC TGGTATGCAC CGTTCTATGA TCTGATTCAA 
ACCGCGCTAA GTTCGCCGCA TAAAGTCACT ATCGAACAAT TTTACCGCGA AGTGGGCGTC 
TTTCTGGGGA TTGCGCTGAT CGCTGTGGTG ATCAGTGTGC TGAACAACTT CTTTGTCAGT 
CACTACGTGT TCCGCTGGCG TACGGCGATG AACGAATATT ACATGGCGAA CTGGCAACAA 
CTGCGTCATA TCGAAGGGGC CGCACAGCGT GTGCAGGAAG ACACCATGCG TTTTGCTTCA 
ACGCTGGAGA ATATGGGCGT CAGTTTTATC AACGCCATCA TGACGTTGAT CGCCTTCCTG 
CCGGTGCTGG TAACGCTCTC CACGCATGTG CCGGAGCTGC CGATTATCGG GCACATTCCG 
TATGGTCTGG TGATTGCCGC TATCGTCTGG TCGCTGATGG GGACCGGATT GCTGGCAGTG 
GTAGGGATCA AACTGCCGGG GCTGGAGTTT AAAAACCAGC GAGTAGAGGC CGCCTACCGT 
AAAGAGCTGG TTTATGGTGA AGACGATGCC ACGCGTGCGA CGCCGCCTAC GGTACGCGAG 
CTGTTTAGCG CCGTGCGGAA AAACTATTTC CGCCTCTATT TTCACTATAT GTATTTCAAC 
ATCGCCCGCA TTCTCTATTT GCAGGTCGAT AACGTTTTCG GTTTGTTCTT GCTGTTTCCG 
TCAATTGTTG CCGGTACGAT TACGCTCGGC CTGATGACGC AGATTACCAA CGTTTTTGGT 
CAGGTTCGCG GTGCTTTCCA GTACCTGATT AACTCATGGA CCACACTGGT TGAGTTGATG 
TCTATCTACA AACGTCTGCG CAGCTTTGAA CATGAACTGG ATGGTGACAA AATTCAGGAA 
GTAACCCATA CCTTGAGCTA A

Protein sequence

MFKSFFPKPG AFFLSAFVWA LIAVIFWQAG GGEWVARITG ASGQIPISAA RFWSLDFLIF 
YAYYIVCVGL FAFFWFIYSP HRWQYWSILG TALIIFVTWF LVEVGVAVNA WYAPFYDLIQ 
TALSSPHKVT IEQFYREVGV FLGIALIAVV ISVLNNFFVS HYVFRWRTAM NEYYMANWQQ 
LRHIEGAAQR VQEDTMRFAS TLENMGVSFI NAIMTLIAFL PVLVTLSTHV PELPIIGHIP 
YGLVIAAIVW SLMGTGLLAV VGIKLPGLEF KNQRVEAAYR KELVYGEDDA TRATPPTVRE 
LFSAVRKNYF RLYFHYMYFN IARILYLQVD NVFGLFLLFP SIVAGTITLG LMTQITNVFG 
QVRGAFQYLI NSWTTLVELM SIYKRLRSFE HELDGDKIQE VTHTLS