Gene Mlg_0265 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0265
Symbol
ID	4270483
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	300745
End bp	301806
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	60%
IMG OID	638124990
Product	Sel1 domain-containing protein
Protein accession	YP_741110
Protein GI	114319427
COG category	[R] General function prediction only
COG ID	[COG0790] FOG: TPR repeat, SEL1 subfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGGCGAC AAGAGCCAGT TTGCTCAGGG TTAACAAAGG TCTTGGCAAT GCCCCGCAAA 
AAAATTCTAG TGTTCATCCT CATCGTTGGC TTATGGGCCG GCACGGCTCA ACCCAACGAT 
GGAGAAGACA AAACATCCCT GAAGCTCAAT GCCGAGCAGC AACAGGCTAA AGAAGAAGGA 
ATGCGCCTGT GGGGCCTGCA TGAATGGATC GACATGCAGC CGCCGCTGGA AGAAGCGGCC 
GGGGCCGGTG ATGTCGAGGC CATCTACTAC CTGGGCGAGG CGAACCGGCT ACTGGATCGC 
GGCATGTCCC GCGAGGCCAT CGACTGGTAC CACCGCGCGG CGCAGGGCGG GGATCCCCAT 
GCCATGCTCC GGCTCGAACA CGGCATGATC TGCAAGTTGG CTGACATTTG CCCCGAGAAA 
TATGAAGCGT GGGTGGACAA GGCTCTCGAG CAGGAACTAC CCAAGGCCGA ACATGGTGAC 
CCGATCGCCA TGTCGACCCT ATTTGATGTC TACAACATGC TCGGGGAACC CCGCACGGCC 
CTAGACTGGC TGGAACGTGC CGCCGAGGCC GGAAACCCGG AGGCCCAAGA TTGGCTGGGA 
ACTATCACCC AGGAACGCTC CGGCGAATGG CCCCCGCAGC TGAAAGACGT CGAAGCCGCC 
GAGCCCTGGT TCCGCAAGGC CGCCGAGCAG GGCTATGCCC CGGCCATATA CAACCTCGTG 
GGGAATCTAA TTCGGCAAGA AAAAATGGAA GCGGCGTGGA ACTGGGTCGT TGAAGGTTCG 
GAGCGTGGGC ATATTCGGAA GCGCATTACC TACGGATTTT GTCACCTCGC CCCAGGGGAG 
TTGATTGATT ACTGCTACCC GGACGAACCC GATCCCGTCA AAGGGTGGGC CATATTGCAC 
GCGCTGTATG AAGAAACACG AGCTAGCACG GCCGAGAGCC TTCTGGAGCG ATACGGGGAG 
CGCCTATCCG ACGAAGAAAT CGCCGAAGCC GAAGAACTCG CCGAGGACTG GCTGAACCGC 
GAGCCCCCAC TGTCCTACTT CCCGCCCAAG TACGGCCTGT AG

Protein sequence

MRRQEPVCSG LTKVLAMPRK KILVFILIVG LWAGTAQPND GEDKTSLKLN AEQQQAKEEG 
MRLWGLHEWI DMQPPLEEAA GAGDVEAIYY LGEANRLLDR GMSREAIDWY HRAAQGGDPH 
AMLRLEHGMI CKLADICPEK YEAWVDKALE QELPKAEHGD PIAMSTLFDV YNMLGEPRTA 
LDWLERAAEA GNPEAQDWLG TITQERSGEW PPQLKDVEAA EPWFRKAAEQ GYAPAIYNLV 
GNLIRQEKME AAWNWVVEGS ERGHIRKRIT YGFCHLAPGE LIDYCYPDEP DPVKGWAILH 
ALYEETRAST AESLLERYGE RLSDEEIAEA EELAEDWLNR EPPLSYFPPK YGL