Gene EcSMS35_0016 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0016
Symbol
ID	6142614
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	18454
End bp	19698
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	41%
IMG OID	641614917
Product	hypothetical protein
Protein accession	YP_001742133
Protein GI	170682715
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.969858
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTACCA ACGTAAATGT TGATTGTTGC AAAACACCAG GATGCAAAAA CCTGGGGTTG 
TTGAATAGCC AGGATTATAT TGCACAAGGA AAAAATATTT TATGTCGGGA ATGCGGTTAC 
TTGTTTCCTG TGATATCTGA ACGATCTCTT AATATTTATC GTAATCGTGT TAATCATTCA 
TGGAGAGGGT TGGTTCCACA ATGTTCAGCT TGCGGAAGCA CATCTCTGAA AAAGTATGGC 
TATTCAGCTC AGGGGCAGAG GAGAATGTAT TGTCATCATT GTTCCAGAAC TTTTATCACT 
CTGGATCATG TAAATACAAC GCCGCGAAGA ACACATTTAG CATTGATGAT TGATCAAGGC 
GCTTCACTTG CAGATATCCG TAAATTATTA CTTCTTAATA GCACAGGGCT TAACCGTGAG 
TTGATGAAAC TAGCCCGGGA AGTAAACTAT AAAGAAAGTT ACCAATACTC TTCTGCTTCT 
GATATTTCTC TATCTACCCG CGCTTTTCGC GTAAAGTTTA ACGGTAGTAA TAACTATCTT 
TATAGCCTTG TTACCGCAGA AGAACAAAGC GGTAGAGTCG TCGCTATTTC AACAAATTAT 
TCTCCATCAG CGGTAGAGTC GCATTATCAA TATGCATCAA GTTATGAAGA GCGTTTGTCT 
CCAGGTACAC TGGCGCATCA CGTACAACGC AAGGAGTTAC TTACTATGCG GCGTGATACC 
TTATTTGATA TTGATTATGG TCGGGCGATA TTACATCAAA ACGATCCGGG GATGTTGGTG 
AAACCGGTTC TTCCGGCGTA TCGCCATTTT GAACTGGTTA GAGCACTGAC TGAAGCATAT 
TCTATAAATA TTCAACACTA CCTTGATCAC GAGTGCTTTA TATTAGGTGG TTGTCTGATG 
GCTAATTTAC AGCATATTCA TCAAGGCCGG TGCCATATTT CATTTGTGAA AGAACGCGGC 
GAGAAAACGA CTCATTATGA TACGCCGCCG CGGTTGTTTT TGAGTGGTGG CGTGAGAAAT 
AATGTTTGGC GTACATTTTC CGCCCGTGAT TATTCAATGG CTGTTTGTAA CCTTACAGGA 
AACAAGAAAG CAAATGAAAT GCGGTATTCG ACGTTAGCAA GCGCGACTCG TTTTATCAAC 
TTCCTGGAGT CTCATCCCTT TCTATCCTCA TTAAACCGAA TGTCGCCTGC CAATGTTGTC 
TCCACATTAG ATATTTTCAA GCATCTCTGG AATAAACAGC TATAG

Protein sequence

MFTNVNVDCC KTPGCKNLGL LNSQDYIAQG KNILCRECGY LFPVISERSL NIYRNRVNHS 
WRGLVPQCSA CGSTSLKKYG YSAQGQRRMY CHHCSRTFIT LDHVNTTPRR THLALMIDQG 
ASLADIRKLL LLNSTGLNRE LMKLAREVNY KESYQYSSAS DISLSTRAFR VKFNGSNNYL 
YSLVTAEEQS GRVVAISTNY SPSAVESHYQ YASSYEERLS PGTLAHHVQR KELLTMRRDT 
LFDIDYGRAI LHQNDPGMLV KPVLPAYRHF ELVRALTEAY SINIQHYLDH ECFILGGCLM 
ANLQHIHQGR CHISFVKERG EKTTHYDTPP RLFLSGGVRN NVWRTFSARD YSMAVCNLTG 
NKKANEMRYS TLASATRFIN FLESHPFLSS LNRMSPANVV STLDIFKHLW NKQL