Gene Mlg_1274 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1274
Symbol
ID	4268937
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	1477051
End bp	1478430
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	74%
IMG OID	638126024
Product	hypothetical protein
Protein accession	YP_742113
Protein GI	114320430
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.373171
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCCCA CCGATCTGAT CAAGCGGCTG CTGCCCACCT CCGGCAAGGC AACCGACAAG 
GCGCCGGAGC CATCGGCCCG GTCGGCCCCC CACGATTCCG CAGGCCAGGC CCGGCTGATC 
GCCATCGCCC GGAGCGATGC CGAACCCGGC GCCCGGGCCG ACGCGGTCAA GCGGCTGACC 
GATCTCGACA CCCTCCAGGC CTGCCTGGCG CCGGCCACAC CGGCGCCCGT CCGGATGGCG 
GCGGTGGCAC GCTTGAGCCT GCTGCTGAAA TCGGACGACC CGGGCCTCGC CCCGCAGGAG 
CGGGTGGCGG CTGTCCGCCA TTGCCCCGAC ACCACCGTCC TCGCCCACCT GGCACAGTCG 
GCCCGGCTCG AGGCCGTGCG ACGGGCGGCA CTGGACCGCC TGCGCACCCC CGCGGCCTGT 
CTCCAGGCCG CGCTGCACGA CCCGGTCCGA CGGCAACGCA AGTTTGCCGT TGAGTGCGTC 
GACCACCTGG AGACCCTGGA GGCGATTGCT GCCCAGAGCG ACGACCGCGG CGTGGCCCGT 
CTGGCCCGGC GCCGCCTGCA GGCCCTCCGC GACGAGCAGG CCGAGCAGCA GGCGGTCCAG 
ACCCAGGCGG TGGGGCTGTG CGAGGCCATG GAGGCGCTGG CAAGCGCGCC TTGGCGCGAT 
GACCTGCCGG CCCGTCGCCA GCGCCTGGAG AACCAATGGC GGCAACTTGA CCCGACGCCA 
CCCCCGGCGC TGGCGGACCG CTTTGCCCGG GCCCAGGGCC ATTGCGCGGC CCGCAGGGCA 
CCCCAGGCCG GCGACCGGGA AGCGCGGCTG CTGAACGCCC TGGAGGAGGA GGCGCGGGCG 
CTCACCCACC ACCCGGAGCC GGAAGAGGCG CGGCTCCGCC AGCTCCGCGA GTCGCTGGCG 
CGCACCCGCC GGGAATGGCT GCACCTGGGT GCGGACCCGG CCACCGAGGC CCGCTTCCGC 
ACCCGCTACT GGCGTCTGGA ATGCTGGTGT GCCGACGCCC GGCGGTTGCT CGACCAGCAA 
CGGATCATCG AGCAATTGCT CAGTGAGGCC GACGCCCTGC CCCTCACCGA GGCGCCCCCC 
CTTCTGCGCC ACGCCCGGCA GTTGCAGCAG GCGTTGCGAC AGGCCCCGTG GCACAGCGGA 
TTCCCGCTGC CGCGTCTGCT CAGGGAGGGC CAGGCGACGG TCAAGGCGCT GGAGCGCACG 
GCCCGCCATG CCGGCCAGAC CCGCGTGAAA CGGCTGCAGG CCCTCCACCA CCTGATGGCC 
AGCCTGGAAC AGGCCATCGA AGAGCGCGCC TGGGGGCGGG CCCGCCGACT AATCAGCGAG 
GCCCTGCGCG AGACCGGCGA GCGGCCCGCC GGCCCCGCTG GGGATCAGAG GAAGAGGTAG

Protein sequence

MSPTDLIKRL LPTSGKATDK APEPSARSAP HDSAGQARLI AIARSDAEPG ARADAVKRLT 
DLDTLQACLA PATPAPVRMA AVARLSLLLK SDDPGLAPQE RVAAVRHCPD TTVLAHLAQS 
ARLEAVRRAA LDRLRTPAAC LQAALHDPVR RQRKFAVECV DHLETLEAIA AQSDDRGVAR 
LARRRLQALR DEQAEQQAVQ TQAVGLCEAM EALASAPWRD DLPARRQRLE NQWRQLDPTP 
PPALADRFAR AQGHCAARRA PQAGDREARL LNALEEEARA LTHHPEPEEA RLRQLRESLA 
RTRREWLHLG ADPATEARFR TRYWRLECWC ADARRLLDQQ RIIEQLLSEA DALPLTEAPP 
LLRHARQLQQ ALRQAPWHSG FPLPRLLREG QATVKALERT ARHAGQTRVK RLQALHHLMA 
SLEQAIEERA WGRARRLISE ALRETGERPA GPAGDQRKR