Gene EcSMS35_4209 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4209
Symbol
ID	6143080
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	4306913
End bp	4308403
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	51%
IMG OID	641619032
Product	integral membrane protein
Protein accession	YP_001746160
Protein GI	170682802
COG category	[S] Function unknown
COG ID	[COG3333] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.000736829
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGTTTGAAA GTGAACTTTT AACTCAGGGT TTTTCGACAT TACTCAATAA TCCTCAGGCG 
CTGCTGTTTG CCACTTTTGG GGTGATGCTG GGTATTGTGA TTGGCGCTTT GCCTGGTCTG 
ACAGCGACCA TGGGTGTGGC GATTTTGCTG CCTTTCACCT ACGGCATGGA GCCTGTTTCT 
GGCTTGTTGA TGATTTGCGG CGTCTTTTTT GGTGGCGTCT ACGGTGGTTC TATCACCGCA 
ATTTTGCTCA AAATTCCCGG AACGCCTGCC GCCGCAGCCA CCGCTATTGA TGGTTATGAG 
CTGACGAAAC AGGGAAAAGC AGGGCTGGCA TTGAGTGCCG CCACGTTCTC TTCCTTTAGT 
GGCGGAACGC TCAGCATTAT CGTGCTGATG TTTCTCTCTC CGGTACTTGC CAGTTGGGCG 
CTGAAATTTA GTGCCTCGGA GTCCTTCGCC CTGGCAACCT TCGGACTGAG CATTATTGCC 
AGTATTTCCG GTGAGTCACT GATTAAAGGG CTGATTGCCG GGGTTGGCGG ATTGCTGATC 
GCAACGATAG GCCTTGATCC AATGGGCGGT TTTCCACGGT TTACAGGTGG ATTTGTGGAG 
CTGATGAATG TGCCATTTAT CCCGGTGATG ATTGGTTTAT TTGCTGCTTC AGAAGCATTC 
CGCTCTATGG AGCAAAACCA GCAAATTCGT CAGGGGGCGA AGGTGGCTAT CGGCAGTCTG 
TTACTGCCCT GGCAAACACT ACGCCGCATT GCATTAACCA TTTTGCGCTC ATCAGGATTA 
GGGGTTTTTA TCGGCATGAT CCCCGGTGCG GGGGCGGATA TTGCAGCTTT TGTTGCCTAT 
AACGAAACTC GTCGTTTCAG TAAGACACCA GAAAACTTTG GTAAGGGTGA AATTAAAGCT 
GTGGCCTCCT GTGAGGCAGG CGCGAATGGC TGCACCGGTG GCGCATTGTT ACCTATGCTG 
ACGCTGGGGA TCCCTGGCGA TGCGGTAACC GCCATCATGC TGGGCGCGTT AACGTTACAG 
GGAATGCAAC CAGGCCCGCT GATGTTTACC GACCACGGCG ATATGGTTTA TACACTGTTT 
GTCGGCATGA TCTTCTGTTA CTTCATGCTA CTAGTTCTTG GACTGCTCTC TTTGAAAGTC 
ATCGGTAATG TGGTGAAAAT TCCCGGCAAT ATTCTCACAC CGATGATCCT CGCACTTTGT 
GTGGTCGGGA CTTATGCGTT GAACAATAGC CTGTTTGATG TTGGCATTAT GCTGATTGCA 
GGCGTGGTGG GCTATTTCAT GCAGAAAGGA GGATATCCGG CATCACCCGT AGTGCTGGCA 
TTGATTATGG GGCCAATGGC GGAAAGTAAT TTTCGCCGTG CGCTGTCGCT TTCTGGTGGG 
TCACTCGACT TTCTGTATAC CCGACCGATA ACTCTGGCAT TGCTGACTCT GGCAGCCTTT 
ACGCTACTGA CGCCAATAAT CCGCAAAATA ATGCGTTTAC GGCGTCAATA A

Protein sequence

MFESELLTQG FSTLLNNPQA LLFATFGVML GIVIGALPGL TATMGVAILL PFTYGMEPVS 
GLLMICGVFF GGVYGGSITA ILLKIPGTPA AAATAIDGYE LTKQGKAGLA LSAATFSSFS 
GGTLSIIVLM FLSPVLASWA LKFSASESFA LATFGLSIIA SISGESLIKG LIAGVGGLLI 
ATIGLDPMGG FPRFTGGFVE LMNVPFIPVM IGLFAASEAF RSMEQNQQIR QGAKVAIGSL 
LLPWQTLRRI ALTILRSSGL GVFIGMIPGA GADIAAFVAY NETRRFSKTP ENFGKGEIKA 
VASCEAGANG CTGGALLPML TLGIPGDAVT AIMLGALTLQ GMQPGPLMFT DHGDMVYTLF 
VGMIFCYFML LVLGLLSLKV IGNVVKIPGN ILTPMILALC VVGTYALNNS LFDVGIMLIA 
GVVGYFMQKG GYPASPVVLA LIMGPMAESN FRRALSLSGG SLDFLYTRPI TLALLTLAAF 
TLLTPIIRKI MRLRRQ