Gene EcSMS35_0653 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0653
Symbol	rlpA
ID	6143012
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	664706
End bp	665794
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	57%
IMG OID	641615543
Product	rare lipoprotein A
Protein accession	YP_001742749
Protein GI	170683228
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0797] Lipoproteins
TIGRFAM ID	[TIGR00413] rare lipoprotein A

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0000226966
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTAAGC AGTGGCTCGG GATCTGCATC GCGGCAGGAA TGCTCGCGGC ATGTACAAGC 
GATGATGGTC AGCAACAGAC GGTAAGTGTA CCGCAGCCTG CGGTATGTAA CGGCCCCATA 
GTTGAAATTA GCGGGGCGGA CCCGCGTTTC GAACCACTGA ACGCGACGGC AAATCAGGAT 
TACCAGCGCG ACGGTAAAAG CTACAAAATC GTGCAGGATC CGTCTCGATT TAGCCAGGCG 
GGACTGGCGG CAATCTATGA TGCCGAACCC GGCAGTAACC TGACGGCCTC TGGCGAAGCT 
TTCGATCCGA CACAGTTGAC GGCGGCCCAT CCAACGCTTC CGATCCCCAG CTACGCCAGA 
ATCACTAACC TGGCTAACGG GCGAATGATC GTGGTGCGCA TTAATGATCG CGGTCCTTAC 
GGCAACGACC GCGTTATTTC GCTTTCTCGC GCGGCAGCTG ACCGTCTTAA CACGTCAAAC 
AACACCAAAG TTCGTATCGA TCCGATTATT GTCGCCCAGG ATGGTTCGCT TTCTGGTCCT 
GGTATGGCCT GTACCACAGT TGCCAAACAG ACTTACGCCC TGCCTGCACC TCCCGATTTA 
AGCGGCGGCG CAGGAACAAG TTCAGTGTCT GGCCCGCAGG GTGACATTCT TCCGGTCAGT 
AATTCGACGC TAAAAAGCGA AGATCCGACT GGCGCGCCGG TAACCAGCAG CGGTTTCCTC 
GGCGCACCAA CGACCTTAGC GCCTGGTGTT CTGGAAGGCA GCGAACCAAC GCCTGCACCA 
CAGCCCGTTG TTACAGCTCC GTCGACAACG CCTGCAACCT CGCCTGCAAT GGTGACACCG 
CAAGCCGCCT CGCAAAGCGC CAGCGGCAAC TTTATGGTGC AAGTCGGGGC CGTTAGCGAT 
CAGGCTCGTG CGCAACAGTA CCAACAGCAA CTGGGACAGA AGTTCGGCGT CCCCGGTCGC 
GTAACTCAAA ATGGCGCGGT CTGGCGGATC CAGCTTGGCC CATTCGCCAG CAAAGCCGAA 
GCCAGTACCT TGCAGCAACG TTTGCAAACC GAAGCCCAAT TACAGTCATT TATTACCACC 
GCGCAGTAG

Protein sequence

MRKQWLGICI AAGMLAACTS DDGQQQTVSV PQPAVCNGPI VEISGADPRF EPLNATANQD 
YQRDGKSYKI VQDPSRFSQA GLAAIYDAEP GSNLTASGEA FDPTQLTAAH PTLPIPSYAR 
ITNLANGRMI VVRINDRGPY GNDRVISLSR AAADRLNTSN NTKVRIDPII VAQDGSLSGP 
GMACTTVAKQ TYALPAPPDL SGGAGTSSVS GPQGDILPVS NSTLKSEDPT GAPVTSSGFL 
GAPTTLAPGV LEGSEPTPAP QPVVTAPSTT PATSPAMVTP QAASQSASGN FMVQVGAVSD 
QARAQQYQQQ LGQKFGVPGR VTQNGAVWRI QLGPFASKAE ASTLQQRLQT EAQLQSFITT 
AQ