Gene Mlg_1140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1140
Symbol
ID	4269635
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	1333535
End bp	1335151
Gene Length	1617 bp
Protein Length	538 aa
Translation table	11
GC content	70%
IMG OID	638125889
Product	hypothetical protein
Protein accession	YP_741979
Protein GI	114320296
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.208936
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCCTGT TTTGGCAGGT CACCGCCCGG ACCGGTTGGC TCCCTTGGAA TAGTTGCCGC 
CTGCCCGAAT CCCTGGCGCA GGCCGACCCG GAGCACGATG CCTCCGGAAA CGGCGTCCGC 
ATCGGGATCA CCGCCCGCCA TGACGACGCC GTCGGCACCG GTCCCGGCCA ATCCGGGCAG 
AGTTTCGCGG TCACCCCCAG CCTGGCCCTG GACGGTCACG TCATCGTTCC CACCGTGGAG 
CCCGGGGCCA ACGGCGCGAC GACGCCGCTG CGAACGCAGG GCCAGCACGC CTTCGACTTC 
GGCCGTGGCG AGATCGCCCT CGCGCCCATC CAGCTGCCCG ATCCCGCCAA GGCGGAGCCG 
GTCATCGTCC CCTTCGGCCT TGATGCCAAT CACCCCGATG CCCGCTCCAT CGGCCGCTAC 
TGCCTGCACA TCGAGCCCGT GCTCCACGGC CATGCCGCCG TCTCCGTGGC GCTGGGCGGC 
GGCGTCGGGC TCGACACCGC CGGGGGCCGT CTCGCCGTCA ACGGCCTCGC CCCCGTGGAG 
CGCGACGGCG TCGATGCCCG ACTGGAGGCC TTCGCCGGCA CCGGACTGGC CGGCCACAAC 
CACTGCCGTC TGCTCTGGCA GCCGCCGGCG AACCTGCTCG CGCGCCTGCC GCGCTACCAG 
GCCATGGCCG AGATCGACCG CGCGGGCTAC GCCCGGGACG AGGCCCGCCA GTGGAAAACC 
CTGACCCGTG CCGAGATCAA CCCCGAAGTA CGCGTCGGGG TCGGCGGCGA GGCCGCCTTC 
CGGCTCGGCC TGCACAACGG CCGCTTCGTG CTGCACGCCT CCCTGCGCCT GGTGCTCGGC 
GTCGGCGGCG GGGGCAGCGT GCGCCTGGCC CTCGACACCC GCCACCTCGA CCTCTGGCTC 
GCCATGATGC ACCAGGCGCT GGTGGAGGTC GGCTACGAGC GCGTCGACTG GATCGACGAA 
GACGCCTTCG AGGAGATGAG CCGCCTGGCC TACCTCGCCG CCATCACCCT GGTCGAACCC 
GCCCTGCTCC TGCTGCGCGG CACCCACCGC CTGCGCCAGC TGATCGAATG GTTCACCCGG 
GAGCGGGACA TGGCCAGCCG GATCGCCTAC GAACTCGCCG CCGAGGAACC GCCCAACCTC 
CGGTATGACC CGGAGGCCAG TCGGGAACAC CACAAGCGCG TCCAGCAACT GCGCGCCTGG 
GTGCGCCAAC TGCCGCCCGA GGCCCTCGGG CCGCTGCTTT ATACCCTGAC CAGTCAGCCG 
CAGGCGTTCG AGGTGGAGGA GAACCAATAC AACGTGGAGC AAGCACGAGG ATTCCACCAG 
CGGGCGATCC TCAACTGCCT GCAATGGATT GTCTCCGGCG TCCTGGCCGG CGTCTACGGG 
CCCCGGCGCG AGTTCTCCGC AGAGCACCCG AACCCGGCGC AAAAGTTGTT TGAAAAGGCC 
GTGGTGCGCA TGGCCCGAGA CGGACAGCCT ACCGACGCAT CGAGGGCCGA TGCGTATGCC 
GAGAACCGAG GGCGGCTGGA TCAGTTCATA TCAGGGGGCC GCGCTACCCC TGAGCAATCC 
GATATGCAAA GGAAATACAG ACAGAATGCC GGCTGGCTTT CCCGCCACAT TCAGTAG

Protein sequence

MLLFWQVTAR TGWLPWNSCR LPESLAQADP EHDASGNGVR IGITARHDDA VGTGPGQSGQ 
SFAVTPSLAL DGHVIVPTVE PGANGATTPL RTQGQHAFDF GRGEIALAPI QLPDPAKAEP 
VIVPFGLDAN HPDARSIGRY CLHIEPVLHG HAAVSVALGG GVGLDTAGGR LAVNGLAPVE 
RDGVDARLEA FAGTGLAGHN HCRLLWQPPA NLLARLPRYQ AMAEIDRAGY ARDEARQWKT 
LTRAEINPEV RVGVGGEAAF RLGLHNGRFV LHASLRLVLG VGGGGSVRLA LDTRHLDLWL 
AMMHQALVEV GYERVDWIDE DAFEEMSRLA YLAAITLVEP ALLLLRGTHR LRQLIEWFTR 
ERDMASRIAY ELAAEEPPNL RYDPEASREH HKRVQQLRAW VRQLPPEALG PLLYTLTSQP 
QAFEVEENQY NVEQARGFHQ RAILNCLQWI VSGVLAGVYG PRREFSAEHP NPAQKLFEKA 
VVRMARDGQP TDASRADAYA ENRGRLDQFI SGGRATPEQS DMQRKYRQNA GWLSRHIQ