Gene EcSMS35_A0076 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_A0076
Symbol
ID	6106573
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010488
Strand	-
Start bp	56954
End bp	58456
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	32%
IMG OID	641614823
Product	hypothetical protein
Protein accession	YP_001739964
Protein GI	170650830
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.000174847
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGAAAT TTTATCAATT TAGGGATGAA CAGCGAAAGG AGCTTGAACA ACATGATTTT 
TATAGTTTGA TTTCTTCAGA TTGTATAGCG TTGAAAGACA AACTATTATT TGCTCCTGTT 
ATGGCTCATT TCATAATGAA CTTCAGAGAC ATGAATAAAT GGGTTATCAG GTTTGATAAC 
AATGATAATG AATATAAATC TGTTATAAAC GGTGGAACAA TCGAGGATGA AACACATTCA 
AGATTGTTTC TGGAAGACTG GAGGAAACTA TATATAGATG ACAAACTTAA CTGGAAAGCA 
AGTGATGTTA TATACTGGTT GTTTATTAGT CGAGAAATGG AGTGTTTCCG AAAATTTGGT 
ATTGATTTTA TGAGACTTTG TGTAGATGAT GGAGGAGACC CAATACTTCG ATATTCTCAC 
TCCGAGTCAG GAGAAACTTG CGGTAATATA TTCTTTTCAA GAATTAGTCC TATTGCTGAT 
CAAGTTGCCA ATCATTTGGG AATATCACTC CGTTATTTTG GAACATTTCA CCTTAATCTT 
GAAAATGGAC ATGTATGGAA GTCAGAAGGT GTTTTTGAAA ATATAGAGTT GTCACCAGAT 
TCTTATAAGA AAATGGCTAC TCTATCAAAG AGAATGTTTG ATATATTTGA AGGAATTCAT 
GACTCTTTTT ATAATTACCT GTCCAGTTAT GTTCTTAATG GAAGTCATCC GTCATTTTTT 
GAATCATTAC CTGTAGGGAA AAATGTTGCA CCTATATACC CTGAATTTGT GATAGAAAAC 
AAAAGCCATA ACGATGGTAG ACATATTGAA CATATAAACA ATTACCTGGA AAAAATATCG 
AGTCATGAGT TCTTTAAATG GCTGATTAAC ACCTCAATAG ACCCTCAATT GAAATTGAAA 
AGTTTCATAC CTCTTTGGAT TGTTGATATT ATGGGGTATA GAGATATTAA TAAATATGTT 
TTTACATATG AACAGCCTGA ATCAGAAAGT GAAAAGATTA TAAATGATTA TGCATTACAC 
TTGTCAGAGC ATAGCCGTTT ATTTTATCAT GACTGGAAGT CACTTCAACT TGATGATATG 
TTACGTTGGA GTGCCAGTGA TACTCTTGAG TTTATTTTTC TTAATTCAGA TATGGATATG 
CATAGAGAAA ATATAGTTAA GTTTTCTTTG TTCGGATTAA AACACAGAGA TCCTGTTATC 
AGGTTCTGGT TTATGATGAT ACTGGAGTTA AGTGGAAAAG AATTTTTCTC TCATGTTGGA 
GATATAGCTT TACAGGTGGA AAGTAAATAT AATATTTATC TCCCATATTT ATGTGGACGC 
CATGCAACAG AAAATGAGCA TGAAGCATAT AATAATATGT ATGAGCATTT TATGGTAAAG 
GAACTTAGCC CTGAACAAAG TGATCTAATA ATACAAATTA CAGACATGGT TATGCGGTCA 
TTATTGAATA ATTTGGATAT CTCATATCGA TATGTAGTAA ATAATTTATT GGCAGCTCGT 
TAG

Protein sequence

MKKFYQFRDE QRKELEQHDF YSLISSDCIA LKDKLLFAPV MAHFIMNFRD MNKWVIRFDN 
NDNEYKSVIN GGTIEDETHS RLFLEDWRKL YIDDKLNWKA SDVIYWLFIS REMECFRKFG 
IDFMRLCVDD GGDPILRYSH SESGETCGNI FFSRISPIAD QVANHLGISL RYFGTFHLNL 
ENGHVWKSEG VFENIELSPD SYKKMATLSK RMFDIFEGIH DSFYNYLSSY VLNGSHPSFF 
ESLPVGKNVA PIYPEFVIEN KSHNDGRHIE HINNYLEKIS SHEFFKWLIN TSIDPQLKLK 
SFIPLWIVDI MGYRDINKYV FTYEQPESES EKIINDYALH LSEHSRLFYH DWKSLQLDDM 
LRWSASDTLE FIFLNSDMDM HRENIVKFSL FGLKHRDPVI RFWFMMILEL SGKEFFSHVG 
DIALQVESKY NIYLPYLCGR HATENEHEAY NNMYEHFMVK ELSPEQSDLI IQITDMVMRS 
LLNNLDISYR YVVNNLLAAR