Gene Mlg_1114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1114
Symbol
ID	4269838
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	1303607
End bp	1304704
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	67%
IMG OID	638125866
Product	porin
Protein accession	YP_741956
Protein GI	114320273
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3203] Outer membrane protein (porin)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.600912
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACGCA GATTACTCGC CCGGGTCACC GGTCTAGCCC TTCTCGCCCC ACTGGCATGG 
ACGGCTAATG CCGCCGATCC ATCGGTAGAT GTCTACGCCG TGCTCCATTT GTCGCTGGAT 
CACCTGGACA ACCGCGAGAG CGACAGCCAG TTCCTCTCCA CCAATCAGTC CCGCCTGGGC 
ATCCGGGGCA GCACCGCCCT GTCCGCCGAC ACCCGTGCCC TCTTCCAGTA CGAAACTGAA 
GTCAATGCCA CGGAAGGCGG CTCGGGGCTC TTCCGCCGCA GCCGCCACAG CTTTCTGGGC 
CTGAGCGGGC CCTACGGCAC CGTCCGTGGG GGCAACCTGG ACGGCCCCCT CAAGGCCCTG 
ACCGACCGCA CCCAGTTCTT CACCGCCCGA CTGGGTGACC CCGGCAACCT GATTGCCGGT 
GCCGGCGTGA CCTGGGAGGA CACCATCGGC GCGGCAGACG CCCCCGGCCA CCTGCGCCGG 
CACAGCAATG CGATCGACTA CACCACACCG GAATGGCAGG GCCTGAGCGC CACACTCATG 
GGCACCCCGG CACAGGGTGA ATCCAGTGCC CAGACCGGTT CCTGGATGGT GCGCTGGCAA 
CAACCCGCCT TTCAGCTGGC CGCCGGCTGT GTTCACAGCC GTTCCGGCAA CTTCGCCAAC 
GGCGATCGTA GCCAGACGAC CCGCCAGCTG CTCGCGCAAT ACCGCGAAGG GGCCATCAAC 
CTGGTCGCCA TTGTCCAGGA CCACCAACAC ATATCTGGAC GGGGGGACCG GGATGCCCGC 
GCCGGCCTTC TCGGCCTGGG CTACCGGGTC GCACCCGGCC TCGAACTCCA GGGGCAGGTC 
GCGCACTTCG ACGACGACCG CGGCAGTGAC CATGACTCCA CCCTTTACAC CGTGGGTGTG 
GAGCATGCGA TGAATCCGCG GGCCCGGGTG TATCTGAATT ACGCCCAGGT CCGCAACGGG 
GATCTGGCCG GCCGTAGCGT GGCAGGGCAG TCCCATGCCC CGCCACCCGG GCCTGACAGC 
AGCCGCAGCC GCATGCTGGA GGTGGCGGAC GGCAACAACC AGTGGGGGGT GTCCGCCGGG 
ATGCTTTACG TCTTTTAA

Protein sequence

MKRRLLARVT GLALLAPLAW TANAADPSVD VYAVLHLSLD HLDNRESDSQ FLSTNQSRLG 
IRGSTALSAD TRALFQYETE VNATEGGSGL FRRSRHSFLG LSGPYGTVRG GNLDGPLKAL 
TDRTQFFTAR LGDPGNLIAG AGVTWEDTIG AADAPGHLRR HSNAIDYTTP EWQGLSATLM 
GTPAQGESSA QTGSWMVRWQ QPAFQLAAGC VHSRSGNFAN GDRSQTTRQL LAQYREGAIN 
LVAIVQDHQH ISGRGDRDAR AGLLGLGYRV APGLELQGQV AHFDDDRGSD HDSTLYTVGV 
EHAMNPRARV YLNYAQVRNG DLAGRSVAGQ SHAPPPGPDS SRSRMLEVAD GNNQWGVSAG 
MLYVF