Gene EcE24377A_0658 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_0658
Symbol	rlpA
ID	5586476
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	686778
End bp	687866
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	58%
IMG OID	640924375
Product	rare lipoprotein A
Protein accession	YP_001461801
Protein GI	157158068
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0797] Lipoproteins
TIGRFAM ID	[TIGR00413] rare lipoprotein A

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0000000302889
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTAAGC AGTGGCTCGG GATCTGCATC GCGGCAGGAA TGCTCGCGGC ATGTACAAGC 
GATGATGGTC AGCAACAGAC GGTAAGTGTA CCGCAGCCTG CGGTATGTAA CGGCCCCATA 
GTTGAAATTA GCGGGGCGGA CCCGCGTTTC GAACCACTGA ACGCGACGGC AAATCAGGAT 
TACCAGCGCG ACGGTAAAAG CTACAAAATC GTGCAGGATC CGTCTCGATT TAGCCAGGCG 
GGACTGGCGG CAATCTATGA TGCCGAACCA GGCAGTAACC TGACGGCCTC TGGCGAAGCT 
TTCGATCCGA CACAGCTGAC GGCGGCCCAT CCAACGCTTC CGATCCCCAG CTACGCCAGA 
ATCACTAACC TGGCTAACGG GCGAATGATC GTGGTGCGCA TTAATGATCG CGGCCCTTAC 
GGCAACGACC GCGTTATTTC GCTTTCTCGC GCGGCAGCTG ACCGTCTTAA CACGTCAAAC 
AACACCAAAG TTCGTATCGA TCCGATTATT GTCGCCCAGG ATGGTTCGCT TTCTGGTCCT 
GGTATGGCTT GTACCACAGT CGCCAAACAG ACTTACGCCC TGCCTGCACC TCCCGATTTA 
AGCGGTGGCG CGGGAACAAG TTCAGTGTCT GGCCCGCAGG GTGACATTCT TCCGGTCAGT 
AATTCGACGC TAAAAAGCGA AGATCCGACC GGCGCGCCGG TAACCAGTAG CGGTTTCCTC 
GGCGCACCAA CGACCTTAGC GCCTGGTGTA CTGGAAGGCA GCGAACCGAC GCCTGCGCCA 
CAGCCCGTTG TTACAGCTCC GTCGACAACG CCTGCAACCT CGCCTGCAAT GGTGACACCG 
CAAGCCGCCT CGCAAAGCGC CAGCGGCAAC TTTATGGTGC AAGTCGGGGC CGTTAGCGAT 
CAGGCTCGTG CGCAACAGTA CCAACAGCAA CTGGGACAGA AGTTCGGCGT CCCCGGTCGC 
GTAACTCAAA ATGGCGCGGT CTGGCGGATC CAGCTTGGCC CCTTCGCCAG CAAAGCCGAA 
GCCAGTACCT TGCAGCAACG TTTGCAAACC GAAGCCCAAT TACAGTCATT TATTACCACC 
GCGCAGTAG

Protein sequence

MRKQWLGICI AAGMLAACTS DDGQQQTVSV PQPAVCNGPI VEISGADPRF EPLNATANQD 
YQRDGKSYKI VQDPSRFSQA GLAAIYDAEP GSNLTASGEA FDPTQLTAAH PTLPIPSYAR 
ITNLANGRMI VVRINDRGPY GNDRVISLSR AAADRLNTSN NTKVRIDPII VAQDGSLSGP 
GMACTTVAKQ TYALPAPPDL SGGAGTSSVS GPQGDILPVS NSTLKSEDPT GAPVTSSGFL 
GAPTTLAPGV LEGSEPTPAP QPVVTAPSTT PATSPAMVTP QAASQSASGN FMVQVGAVSD 
QARAQQYQQQ LGQKFGVPGR VTQNGAVWRI QLGPFASKAE ASTLQQRLQT EAQLQSFITT 
AQ