Gene Mlg_1891 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1891
Symbol
ID	4270091
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2154888
End bp	2155937
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	66%
IMG OID	638126647
Product	porin
Protein accession	YP_742725
Protein GI	114321042
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3203] Outer membrane protein (porin)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0840152
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.0627255
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGATTAGGC AATCGGGGAT TCGCTTCGTG GCTGTCGGCG GCCTGTCGCT GCTGGTGGCG 
TTACCCGCCG TGGCGCAGCC GCTGGACTGG CCTGAGCTCT ACGGGCGGCT GCACCTCTCG 
GCCGACGTGC TGAACAACGG CGATGGCACC TCGCGCCACC TCTCGGACAA CTCCAGTCGC 
TTGGGTTTGC GCGGCCAAGT GCTGTTGGAT GATGACCGCC TGCGCGCCGT CTACCAGGTG 
GAGATACAGG CGGCGCTGAA CGAGGATGAC AGCAGCGATG AGCTGACCTT GCGCAACACC 
TTCGCGGGCC TGGAGGGCCC CTGGGGGCTG CTGCGCGCCG GTCGGATTGA CACGCCGGTA 
AAGCGCATGC GCAGCAACGT GGACCCGTTC AGCGACAGCG TGGGGGACGC CCGAAACATC 
CTGCGCCTGA ACACGGCCGC CTATGATGAC CGGGACCTGC GGGTGAACTT TGACCGCCGT 
CTGAAGAATT CCCTCAACTA CACCACCCCC CGCTACCAGG GACTGGGTGC GCAGTTGCAT 
TACTCCGCCG ACGCGGAAGG TGACGGCAGC GCCAGCGATA ACGATGACGA GGCCTGGAGC 
GCGATGCTCG ACTATGAGCG GGACGCGACC TGGGTGGGAC TCGGCTATGA GCGTTACCGG 
GCCGGTGAGA CACCGACCAT CTGGCGGGTG GCGGCCAGCC AGGGGCTTGG CGACTGGCGG 
CTGACCGGTC TTTACCAGTC CACGCGTGAT CCGGACAGCT GGGCCCTGGG TGGCTCTGTG 
ACCTATGCCT TCGGGGTGAA CCGGCTTCTG GCGCAGGTCT ACACGGTGGA CGCGAGGGAT 
GGCGATGACC TGGACGCGAC GATGTACGCG CTGGGTGCCG AGCGCTTCCT GGCGGACAGC 
GTGCGGGTCT ATCTGCGCCT GGCGTGGCTG GACAACGATG ACGAAGGGGA TCTGACCCCC 
TACCGCCAGT CCCGTTCCGC CGACCCGGAG ATGGATACCC CGGGTGAAGA CCCCTATGGC 
GTCTCTGTGG GGTTACGGAT CGACTTCTGA

Protein sequence

MIRQSGIRFV AVGGLSLLVA LPAVAQPLDW PELYGRLHLS ADVLNNGDGT SRHLSDNSSR 
LGLRGQVLLD DDRLRAVYQV EIQAALNEDD SSDELTLRNT FAGLEGPWGL LRAGRIDTPV 
KRMRSNVDPF SDSVGDARNI LRLNTAAYDD RDLRVNFDRR LKNSLNYTTP RYQGLGAQLH 
YSADAEGDGS ASDNDDEAWS AMLDYERDAT WVGLGYERYR AGETPTIWRV AASQGLGDWR 
LTGLYQSTRD PDSWALGGSV TYAFGVNRLL AQVYTVDARD GDDLDATMYA LGAERFLADS 
VRVYLRLAWL DNDDEGDLTP YRQSRSADPE MDTPGEDPYG VSVGLRIDF