Gene EcSMS35_0748 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0748
Symbol
ID	6145143
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	755325
End bp	756695
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	55%
IMG OID	641615637
Product	hypothetical protein
Protein accession	YP_001742836
Protein GI	170680011
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	0.719749
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTCGTT CTTTTAAAGT CTTATCGCCA ACGGCAATCC TCGGGTATGG ATTCCCGGAA 
GAGAGCTTCC GCAAAGCGAT GGCAGAATCG CCCGATCTGA TCGCCGTTGA TGCAGGCTCT 
TCCGATCCTG GCCCCCACTA CCTCGGGGCG GGCAAACCGT TTACCGATCG CGCAGGGGTC 
AAGCGTGATT TGCGCTATAT GATCACCGCA GGCGTGCAAA ATAATATACC GGTGGTGATC 
GGAACGGCCG GCGGTTCTGG TGCCGCTCCA CACCTGGAGT GGTGCCGAGA AATAATTCAT 
GAGATTGCCC GGGAAGAGCA ACTCGCGTTC TCGATGGCGC TGATCCCGGC AGACGTTGAC 
AAAGCCATCG TCCACCAGGC GCTGGATAAC GGCAAAATCA CGGCGCTGGA TTTTGTCCCG 
CCGTTAACCC ACGACGCGAT TGACGAAAGT ACGTATATCG TCGCGCAAAT GGGCATCGAA 
CCCTTCCAGC GGGCGCTGAA AGAAGGCGCG CAAGTGGTGC TGGGCGGGCG CGCTTACGAC 
CCGGCCTGCT TTGCTGCGCT CCCGATCATG CAAGGCTTTG ATGAAGGTCT GGCGCTGCAT 
TGTGGGAAAA TCCTTGAATG CGCGGCAATC GCCGCAACGC CCGGCTCAGG CTCTGACTGT 
GCGATGGGCA TCATTGATGA CAACGGCTTT ACGCTGAAGA CATTTAATCC GAAGCGTAAA 
TTTACCGAAA CGTCAGCGGC TGCACACACA CTGTATGAGA AATCCGATCC CTACTTCCTG 
CCTGGACCTG GCGGCGTGTT GAACCTGAAA GGCTGCACAT TTAAAGCGGT CAATGACGGC 
GAAGTGTACG TCAGCGGTTC TAAGCATGAA GAAACGCCGT ATGCCCTGAA ACTGGAAGGT 
GCGCGACGGG TGGGCTTCCG CTGTCTGACC ATCGCAGGAA CGCGCGACCC GATCATGATC 
GCCGGGATCG ATAAAATCAT CGATGAAGTC AAAACCAGCG TTTCACGTAA CCTGTCGCTC 
GACGATGACA GCATTCGCAT CAATTTCCAC CTGTACGGCA AAAACGGGGT GATGGGCGAC 
CATGAACCGA TGCAAACTGC CGGGCATGAG CTGGGGATTG TCCTTGATGT AGTTGCACCG 
ACCCAGGAAA TTGCCAATAG CGTTTGCTCG CTGGTGCGCT CTACCATGCT GCACTACGGC 
TATGAAAACC GCATCGCTAC CGCAGGCAAT CTGGCGTTCC CGTTCTCCCC TTCTGATATC 
CAGGGCGGGC CGGTATACGA ATTTTCCATA TATCACCTGA TTGAAGCCAA CGACGCTCTG 
CGTTTTGATT TCCATATTGA ACAGGTGACG CCAGAAGGAG TTCAGGCATG A

Protein sequence

MARSFKVLSP TAILGYGFPE ESFRKAMAES PDLIAVDAGS SDPGPHYLGA GKPFTDRAGV 
KRDLRYMITA GVQNNIPVVI GTAGGSGAAP HLEWCREIIH EIAREEQLAF SMALIPADVD 
KAIVHQALDN GKITALDFVP PLTHDAIDES TYIVAQMGIE PFQRALKEGA QVVLGGRAYD 
PACFAALPIM QGFDEGLALH CGKILECAAI AATPGSGSDC AMGIIDDNGF TLKTFNPKRK 
FTETSAAAHT LYEKSDPYFL PGPGGVLNLK GCTFKAVNDG EVYVSGSKHE ETPYALKLEG 
ARRVGFRCLT IAGTRDPIMI AGIDKIIDEV KTSVSRNLSL DDDSIRINFH LYGKNGVMGD 
HEPMQTAGHE LGIVLDVVAP TQEIANSVCS LVRSTMLHYG YENRIATAGN LAFPFSPSDI 
QGGPVYEFSI YHLIEANDAL RFDFHIEQVT PEGVQA