Gene Mlg_0533 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0533
Symbol
ID	4268062
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	576720
End bp	578396
Gene Length	1677 bp
Protein Length	558 aa
Translation table	11
GC content	70%
IMG OID	638125274
Product	surface antigen (D15)
Protein accession	YP_741377
Protein GI	114319694
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0729] Outer membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.478623
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCCGG CGGCCCATGG CGTGGAGGTC CGGGTGGAGG GCGTCAGTGG CGCCCTGCGG 
GACAATGTCG AGGCCTGGCT GGGCGAGCCC GCCGGCGACA GCCGCCGGGC CCTGCGCACT 
TACGAGCGCC AACTGCCGGA ACGGGCCGCT CAGGCCCTCC AGGCGCTGGG TCACTACCGG 
CCGCAGATCG ACGTCGAGCG CGAGGAGACC GATAACGGGC CGCGGTTCAT CCTGCGCATC 
GATCCGGGCG AGCCGGTGCG CATCGCCGCG GTGGATCTGC GCATCGAGGG CGAGGCGCGT 
GACGACCCGG CTTTCGAGGG CATCCAGGCG CGGCTCGCCG TGCAGCCGGG TGACGTGCTG 
CGCCATGACC GCTACGAGAC GGCCCGCCGG CAGCTGCAGA GCCTGGCGCT GGACCGGGGC 
TACTTCGATG CCCGCTACAC CCGGCGGCGG GTGGAGGTGG ACGTGGCGGC CGGTGAGGCC 
ACTGTGATGC TCCACTTCGA TACCGGTCGT CGCTATCGGC TCGGGGAGGT GACGTTCTCC 
GAGACAGCGC TGGCCCCCTG GTTCCTTCAG CGGCTGGTGC CCTTCGAGCC CGGCGAGCCC 
TACCGGGCAG AGCACATCAC CGCCCTCAAC CGGGCCCTCC GGGACAGCGG GTACTTTGCC 
CGGGTCACCG TCCGCCCTGA GCCCCGGGAG GCCGACGAGG CCCTGCGGGT GCCGGTGGAG 
GTGGAGCTGA CCGCCGAACG CGCCCACCAG GTCCGTCTGG GGGCGGGCTT CTCCACCGAT 
GTCGGACCCC GCATCCGTGC CGGCTGGTCC CGGCCCTGGG TCAATCAACG GGGCCATAGC 
CTGTCGGTGG ATACCGAGCT CTCGGAGCCG CGCCAAAACA TCTCCACCCG GTACAAGATC 
CCGCTGGCCG ACCCGCTGCG CACCCAACTG ATCCTCCAGG CGGGTTTCCA GTTCGAGGAC 
ATTGAGGACA CCGAGAGCGA GCTGCTGACC GTCTCCGTGC AGCACCAGCA CCGCTTCGAC 
AGCGGTTGGC AGCAGAACCT GGGGCTCCGC TGGGACCGGG ACCGGTTCAC GGTCTCCGAC 
GACACCCGCA CCACCACCCT CTATCTGCCC AGCGGCAGCT GGACCCGCAA CCGGGCCCGG 
GGCGGCGCCG ACCCCTACTG GGGCGATCGC CTGCTGTTCA GTGTCGAGGG CACGGACGAG 
TGGATGGGCT CCGATATCGA CCTGCTCCGG GTGCGCACCG GGGCCCGGCT GCTGCGGAGT 
TTTGCGGACA ACCACCGGAT CCTGGTCCGT GGCGACTTGG GTGCGCTCAT CTCCAGCCAG 
TTCGGCAAGG TGCCAACGTC CCTTCGCTTC TTTGCCGGCG GCGATCAGAG CGTGCGCGGT 
TACCGCTACC AGACTCTGGG GCCGGAGGAT GCCGAAGGCG ATGTCATCGG CGGCCGCTAT 
CTGGCGGTGG CCAGTGCCGA GTACGGCTAT ACCTTCCGGC CCCGCTGGCG GGCGGCCGTC 
TTCGCCGATG CCGGCAACGC CTTTGACGAT CTGGACGACC CCGACCCACA GGTGGGGGCC 
GGGTTCGGTA TCCGCTGGAT CTCGCCGGTG GGCCCGATCC GGCTGGACTT CGCCTCGGCG 
CTCAGCAAAT CGGGCAACCC CTGGCGGCTG CACTTCTCCA TGGGGCCGGA GATATGA

Protein sequence

MAPAAHGVEV RVEGVSGALR DNVEAWLGEP AGDSRRALRT YERQLPERAA QALQALGHYR 
PQIDVEREET DNGPRFILRI DPGEPVRIAA VDLRIEGEAR DDPAFEGIQA RLAVQPGDVL 
RHDRYETARR QLQSLALDRG YFDARYTRRR VEVDVAAGEA TVMLHFDTGR RYRLGEVTFS 
ETALAPWFLQ RLVPFEPGEP YRAEHITALN RALRDSGYFA RVTVRPEPRE ADEALRVPVE 
VELTAERAHQ VRLGAGFSTD VGPRIRAGWS RPWVNQRGHS LSVDTELSEP RQNISTRYKI 
PLADPLRTQL ILQAGFQFED IEDTESELLT VSVQHQHRFD SGWQQNLGLR WDRDRFTVSD 
DTRTTTLYLP SGSWTRNRAR GGADPYWGDR LLFSVEGTDE WMGSDIDLLR VRTGARLLRS 
FADNHRILVR GDLGALISSQ FGKVPTSLRF FAGGDQSVRG YRYQTLGPED AEGDVIGGRY 
LAVASAEYGY TFRPRWRAAV FADAGNAFDD LDDPDPQVGA GFGIRWISPV GPIRLDFASA 
LSKSGNPWRL HFSMGPEI