Gene EcHS_A0685 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0685
Symbol	rlpA
ID	5594968
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	700187
End bp	701275
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	58%
IMG OID	640919864
Product	rare lipoprotein A
Protein accession	YP_001457446
Protein GI	157160128
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0797] Lipoproteins
TIGRFAM ID	[TIGR00413] rare lipoprotein A

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	1.7076e-18
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTAAGC AGTGGCTCGG GATCTGCATC GCGGCAGGAA TGCTCGCGGC ATGTACAAGC 
GATGATGGTC AGCAACAGAC GGTAAGTGTA CCGCAGCCTG CGGTATGTAA CGGCCCCATA 
GTTGAAATTA GCGGGGCGGA CCCGCGTTTC GAACCACTGA ACGCGACGGC AAATCAGGAT 
TACCAGCGCG ACGGTAAAAG CTACAAAATC GTGCAGGATC CGTCTCGATT TAGCCAGGCG 
GGACTGGCGG CAATCTATGA TGCCGAACCA GGCAGTAACC TGACGGCCTC TGGCGAAGCT 
TTCGATCCGA CACAGCTGAC GGCGGCCCAT CCAACGCTTC CGATCCCCAG CTACGCCAGA 
ATCACTAACC TGGCTAACGG GCGAATGATC GTGGTGCGCA TTAATGATCG CGGCCCTTAC 
GGCAACGACC GCGTTATTTC GCTTTCTCGC GCGGCAGCTG ACCGTCTTAA CACGTCAAAC 
AACACCAAAG TTCGTATCGA TCCGATTATT GTCGCCCAGG ATGGTTCGCT TTCTGGTCCT 
GGTATGGCTT GTACCACAGT CGCCAAACAG ACTTACGCCC TGCCTGCACC TCCCGATTTA 
AGCGGTGGCG CGGGAACAAG TTCAGTGTCT GGCCCGCAGG GTGACATTCT TCCGGTCAGT 
AATTCGACGC TAAAAAGCGA AGATCCGACC GGCGCGCCGG TAACCAGTAG CGGTTTCCTC 
GGCGCACCAA CGACCTTAGC GCCTGGTGTA CTGGAAGGCA GCGAACCGAC GCCTGCGCCA 
CAGCCCGTTG TTACAGCTCC GTCGACAACG CCTGCAACCT CGCCTGCAAT GGTGACACCG 
CAAGCCGCCT CGCAAAGCGC CAGCGGTAAC TTTATGGTGC AAGTCGGGGC CGTTAGCGAT 
CAGGCTCGTG CGCAACAGTA CCAACAGCAA CTGGGACAGA AGTTCGGCGT CCCCGGTCGC 
GTAACTCAAA ATGGCGCGGT CTGGCGGATC CAGCTTGGCC CCTTCGCCAG CAAAGCCGAA 
GCCAGTACCT TGCAGCAACG TTTGCAAACC GAAGCCCAAT TACAGTCATT TATTACCACC 
GCGCAGTAG

Protein sequence

MRKQWLGICI AAGMLAACTS DDGQQQTVSV PQPAVCNGPI VEISGADPRF EPLNATANQD 
YQRDGKSYKI VQDPSRFSQA GLAAIYDAEP GSNLTASGEA FDPTQLTAAH PTLPIPSYAR 
ITNLANGRMI VVRINDRGPY GNDRVISLSR AAADRLNTSN NTKVRIDPII VAQDGSLSGP 
GMACTTVAKQ TYALPAPPDL SGGAGTSSVS GPQGDILPVS NSTLKSEDPT GAPVTSSGFL 
GAPTTLAPGV LEGSEPTPAP QPVVTAPSTT PATSPAMVTP QAASQSASGN FMVQVGAVSD 
QARAQQYQQQ LGQKFGVPGR VTQNGAVWRI QLGPFASKAE ASTLQQRLQT EAQLQSFITT 
AQ