Gene EcSMS35_0407 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0407
Symbol
ID	6145805
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	420260
End bp	421354
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	54%
IMG OID	641615303
Product	putative lipoprotein
Protein accession	YP_001742510
Protein GI	170682252
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCGCG TCAATCATCT ATCTTCGCTG TCATTGTTGG CGGTTCTGGT TTTAGCGGGG 
TGTAGTAGTC AGGCTCCGCA ACCGTTGAAA AAGGGCGAAA AAGCGATAGA TGTGGCGAGC 
GTCGTGCGGC AGAAGATGCC TGCGAGCGTG AAAGACCGCG ATGCCTGGGC GAAAGATCTC 
GCCACCACGT TTGAAAGTCA GGGGCTGGCA CCGACGCTGG AAAACGTCTG CTCGGTGCTG 
GCGGTGGCGC AGCAGGAGTC AAATTATCAG GCAGATCCGG CCGTTCCGGG CTTAAGCAAG 
ATCGCCTGGC AAGAGATTGA CCGTCGTGCT GAACGGATGC ACATTCCTGC TTTTCTGGTG 
CATACCGCGC TAAAAATCAA ATCGCCAAAC GGCAAAAGCT ATAGCGAACG GTTAGATTCG 
GTGCGTACTG AAAAGCAATT GAGCGCGATT TTTGACGATC TGATCAGCAT GGTGCCAATG 
GGGCAGACGT TGTTTGGTTC GCTTAATCCG GTGCGCACCG GTGGGCCGAT GCAGGTCAGC 
ATTGCCTTTG CCGAACAGCA TACCAAAGGG TATCCGTGGA AAATGGACGG TACAGTCCGT 
CAGGAAGTCT TCAGTCGTCG CGGCGGGTTG TGGTTTGGTA CTTACCATTT ACTGAATTAT 
CCCGCCAGCT ATAGCGCGCC GATATACCGT TTTGCTGATT TTAACGCTGG CTGGTACGCC 
AGCCGTAATG CCGCGTTTCA GAACGCGGTC AGTAAGGTCA GCGGCGTGAA GCTGGCACTG 
GACGGTGATT TAATTCGTTA CGACAGTAAA GAGCCCGGGA AAACCGAACT GGCAACGCGC 
AAACTGGCGG GAAAACTGGG GATGAGCGAC AGTGAAATTC GCCGCCAGTT AGAGAAAGGG 
GACAGCTTCT CTTTTGAGGA GACGGCGCTG TACAAGAAAG TTTATCAACT TGCCGAAGCG 
AAAACGGGTA AATCACTACC CCGCGAAATG TTGCCTGGCA TTCAACTGGA AAGCCCGAAA 
ATCACCCGCA ACCTGACTAC GGCCTGGTTT GCGAAGCGCG TAGACGAACG GCGGGCGCGT 
TGTATGAAAC AGTGA

Protein sequence

MSRVNHLSSL SLLAVLVLAG CSSQAPQPLK KGEKAIDVAS VVRQKMPASV KDRDAWAKDL 
ATTFESQGLA PTLENVCSVL AVAQQESNYQ ADPAVPGLSK IAWQEIDRRA ERMHIPAFLV 
HTALKIKSPN GKSYSERLDS VRTEKQLSAI FDDLISMVPM GQTLFGSLNP VRTGGPMQVS 
IAFAEQHTKG YPWKMDGTVR QEVFSRRGGL WFGTYHLLNY PASYSAPIYR FADFNAGWYA 
SRNAAFQNAV SKVSGVKLAL DGDLIRYDSK EPGKTELATR KLAGKLGMSD SEIRRQLEKG 
DSFSFEETAL YKKVYQLAEA KTGKSLPREM LPGIQLESPK ITRNLTTAWF AKRVDERRAR 
CMKQ