Gene Shewmr4_1734 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_1734
Symbol
ID	4252308
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	+
Start bp	2061841
End bp	2063091
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	51%
IMG OID	638118345
Product	LolC/E family lipoprotein releasing system, transmembrane protein
Protein accession	YP_733865
Protein GI	113970072
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG4591] ABC-type transport system, involved in lipoprotein release, permease component
TIGRFAM ID	[TIGR02212] lipoprotein releasing system, transmembrane protein, LolC/E family

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00172788
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.754695
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGGAC CATTAGCCCT CTCCATTGGT TGGCGTTTTT ATCGTGCGCG CCAATCCAAT 
AGTTTTATTA GTTTTATCTC CTTTGCATCA ACCGCGGGCA TTGCGCTAGG GGTTGCAGTA 
CTGATTGTGG TGCTCTCAGC AATGAATGGC TTTGAGCGTG AGTTAGAGCA GCGCTTGTTA 
GGTGTGATCT CCCAAGCCGA TGTGGTTGGC GTGAATGAGC CGATTGCCGA CTGGCGCGCA 
GTTGAGCAAA CCGCCATGCA GATTGAAGGC ATTACGGCGG CGGCACCTTT TATTCGGATG 
CAAGGATTAG TACAAAAGCC CGGTGGTTTT CAGGGGCTTG CTGTTGTGGG AATCGACCCT 
GAGCAAGAGG CAAAAGTCTC GACTCTCTCG CAATTTATGT CGAAAGAGAC TTGGCAAGGC 
TTAGGCGAGG ATGACAATCA CATCGTCCTC GGTGAGAGCT TGCTGAAAAA GTTAGGCCTC 
GAAGTTGGCG ATACCCTCGC TCTGTATGTG CAAGATCTTG ATCCTGAACA TGCCGGCAGT 
TTACGGGCGG CCAAGAGCCA TCGCTTTGTG GTGTCGGGTG TGTACCGTTT AGGTGGCGAG 
CTTGAGTTAA CCACGGCGTA TATTCCGATG CGCTATGCGG CGAATATCCT GAATTTACAT 
CAAGGTGTCA CTGGGGTGCG GATCAGTGTG GCGCAGGTGT TTGATGCGCC AGCGAAAATT 
CGTGAGTTGG GTTATGCCTT AAACCAGTCC GTTTATATCA GTGATTGGAC GCGTACCCAA 
GGGCATTTAT ATCAAGATAT TCAATTGGTT CGCACCATTA TGTATCTCGT TTTGGTGTTA 
GTGATTGGCG TGGCCTGTTT CAATATTGTC TCAACGCTAG TCATGGCGGT GCGGGATAAA 
GCCAGTGAAA TCGCCATTCT GATGACCATG GGGTTAAGCC GTCTCTCAGT GATGGGGATT 
TTTATGGTGC AAGGCGCGTT AAATGGCCTT GTAGGTTGTG CCCTCGGCGG TGTGATAGGT 
ATTGCGACCG CGGTGAATCT CAGTGGTATT GCCCGTGGTA TTGAGCAGCT GCTCGGAATT 
CAACTCCTGT CGGCCGATGT GTATTTTGTG GATTTTCTGC CGTCAGAGCT ACATATGACA 
GATGCTGGTT TAGTGATTGC CACGGCGTTT GTGATGAGTC TTATCGCAAC CCTGTATCCC 
GCGTGGAAGG CGAGCCAGAT TGGCCCTGCG CAGGCGTTGG CGGGTAGGTA G

Protein sequence

MKGPLALSIG WRFYRARQSN SFISFISFAS TAGIALGVAV LIVVLSAMNG FERELEQRLL 
GVISQADVVG VNEPIADWRA VEQTAMQIEG ITAAAPFIRM QGLVQKPGGF QGLAVVGIDP 
EQEAKVSTLS QFMSKETWQG LGEDDNHIVL GESLLKKLGL EVGDTLALYV QDLDPEHAGS 
LRAAKSHRFV VSGVYRLGGE LELTTAYIPM RYAANILNLH QGVTGVRISV AQVFDAPAKI 
RELGYALNQS VYISDWTRTQ GHLYQDIQLV RTIMYLVLVL VIGVACFNIV STLVMAVRDK 
ASEIAILMTM GLSRLSVMGI FMVQGALNGL VGCALGGVIG IATAVNLSGI ARGIEQLLGI 
QLLSADVYFV DFLPSELHMT DAGLVIATAF VMSLIATLYP AWKASQIGPA QALAGR