Gene Mlg_2006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2006
Symbol
ID	4270480
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	2275718
End bp	2277907
Gene Length	2190 bp
Protein Length	729 aa
Translation table	11
GC content	69%
IMG OID	638126762
Product	putative PAS/PAC sensor protein
Protein accession	YP_742838
Protein GI	114321155
COG category	[L] Replication, recombination and repair
COG ID	[COG2176] DNA polymerase III, alpha subunit (gram-positive type)
TIGRFAM ID	[TIGR00229] PAS domain S-box [TIGR00573] exonuclease, DNA polymerase III, epsilon subunit family

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.475164
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGTCT CTGATCATAG TGAACACTGG GTGGAGCGGA TCAGCCGGGG TCTGCTCGGC 
CGGCACGCCA CGCCTACCGG CCACACCAGC CGCCGACTGC TGTTCTGGGC GCCGGCAATG 
GGGCTGGCTG TTCTGCTGAC AGGGCTGTTG CTCGGCCTCG CCTATCTCTC CCTCTCCGCG 
CTGCCCGCCG GCGCCGACCC AACACCGCTG GTGGTCGCCT TCGGCGCTGC GGGGCTGCTC 
CTGCTGGCGG CGATCACGGC CATCTGGCTG TTGCTGGATG CCACCGTGCT GCGCTCCCTG 
TCCGCGCTGG CCCGCGATGC GGCCATACTG GCCTACACCA ACCCCGATCA CCGGCTTCAG 
CTGCCGTCGG TGCACCTGCT CGGCGAGTTG CCCGGGACGC TGCGCAACCT CGCCCGCCAG 
TTGCAGGTCC GGCGCCGGGA GGTAGAGGCC GCCGCGGCCA CGGCCGCCGA ACAGGCCGAG 
GCGCAGAAGG CGCGGCTGGA GGTGGTGCTG CGCGCCATCC GGCAGGGGGT CGTGGTCTGT 
GATGCCGACG GACGGATCCT GCTCTACAAC CCCGCCGCCG GTGAGCTGCT CCACAGCGAC 
GCCCTGGGGC TTGGCCGCTC CATCCATGAA CTGTTGAACC CAGCCGCCGT TGAGCACCCC 
CGACAACTGC TGCAACACCG ACTGCGCCAG GATTCGGACG ACCCGGTCAT GGACGAGGGG 
GTGGAGTTCG TCTGTACCAC GGTCGATGAC GGCGCCCTGC TCCGCTGCCA GATGAGTCTG 
CTGCCGACCC ACGGCCCGCT GCGCTCGGCC TTCGTCATCA CCCTGGAGGA CATCACCCGC 
CGGATCGAAG GCGTGGCCCG CCGTGACCAA GCCCTGCGCA GCGCCGTGGA GGCCCTGCGC 
TCGCCCCTGG CCGCGGTGTC GGTGGCGGCG GAGCTGCTCA ACGAGTACCC GCAGATCGAC 
GATGCCCGCC GACGCCGGTT CATCGACATC CTGGCCAAAG AGAGCCACGT GCTGGTCCAG 
CGCTTCGAAC AAATCGCGGA GGCCACTCAG GAGAACGTCT CCGCCCCCTG GACCATGGCC 
GATATCAGCA GCGACGATTT GGTGGACAGC GTGTTGCTGC GCCACCGCGA CACCCTGCCC 
CGCGTGGCGC TGGCTGGCCT GCCCCTATGG CTCCATGCGG AGAGCCACGC CATCGGACTC 
GTGCTCACCC ATCTGTTGCA CCGTCTGGGA CGGGACCACG GCGTCCTGGC CGTGCGCATC 
GAGGCGCTGA TGGGCAACCG CCGGGTGTAC CTGGACATCT CCTGGGCGGG CGAGCCGGTG 
CCGGGCCCCA CCCTAGAGCA GTGGCTTGAG ACCCCGTTGC CGGAGGCCAT AGGGGAATTG 
AACGCCCGCG CCGTGCTCGA GCGGCACAAC AGCCTGGCCT GGAGTCAACG GGACCGGCGA 
ACGCCGGGGT GGGCGTGCCT GCGCATCCCG TTGCCTGCCT CCAGCCGGCA ATGGAACCCG 
CCCGGGGAGA GCCTCCCCCC GCGCCCGGAA TTCTATGACT TCTCTCTCAT CGACCAGGCC 
GCGGACCAGG GCGCTCTCCT CGACCGGCCC CTGGACGCGT TGAACTACGT GGTGTTCGAC 
ACCGAGACCA CCGGCCTGTC TCCAGCGGAG GGTGACGAGA TCGTCTCCAT CGCCGGGGTG 
CGAATGGTCA ATGGCCGCCT CCTGGACGGC GAGCGCTTCG AGCAACTGGT CAACCCCGGC 
CGGACCATCC CCCGCAGCTC GATCCTGTTC CACGGCATTC ACGATACGAC GGTCGCGGAT 
AAGCCCCGCA TCGAAACGGT ACTGCCGCGA TTCCACACCT TCGTCGGCGA CTCAGTGCTG 
GTCGCCCACA ACGCCGCCTT CGACATGAAG TTCATCCGAC TGAAGGAGCG GCGCTGCGGC 
GTGCGCTTCG ACAACCCGGT TCTGGACACG CTGCTGCTCT CGGTCTTTCT CCACGACCAC 
ACCGCGGACC ACACCCTCGA GGCCATCGCC GCTCGGCTTG GGGTGGAGGT GACCGCGCAG 
CACACCGCCT GGGGCGATGC CCTGGTCACG GCACGGGTCT TCGCCTGCCT GTTACCGCTA 
CTGCGCGAAC GGGGGGTCCA CACGCTAAGG GACGCGGTGG CGGCATCAGA GCGGATGGTG 
GAGGTACGCC GGCAACAGGC GCAGTTCTGA

Protein sequence

MSVSDHSEHW VERISRGLLG RHATPTGHTS RRLLFWAPAM GLAVLLTGLL LGLAYLSLSA 
LPAGADPTPL VVAFGAAGLL LLAAITAIWL LLDATVLRSL SALARDAAIL AYTNPDHRLQ 
LPSVHLLGEL PGTLRNLARQ LQVRRREVEA AAATAAEQAE AQKARLEVVL RAIRQGVVVC 
DADGRILLYN PAAGELLHSD ALGLGRSIHE LLNPAAVEHP RQLLQHRLRQ DSDDPVMDEG 
VEFVCTTVDD GALLRCQMSL LPTHGPLRSA FVITLEDITR RIEGVARRDQ ALRSAVEALR 
SPLAAVSVAA ELLNEYPQID DARRRRFIDI LAKESHVLVQ RFEQIAEATQ ENVSAPWTMA 
DISSDDLVDS VLLRHRDTLP RVALAGLPLW LHAESHAIGL VLTHLLHRLG RDHGVLAVRI 
EALMGNRRVY LDISWAGEPV PGPTLEQWLE TPLPEAIGEL NARAVLERHN SLAWSQRDRR 
TPGWACLRIP LPASSRQWNP PGESLPPRPE FYDFSLIDQA ADQGALLDRP LDALNYVVFD 
TETTGLSPAE GDEIVSIAGV RMVNGRLLDG ERFEQLVNPG RTIPRSSILF HGIHDTTVAD 
KPRIETVLPR FHTFVGDSVL VAHNAAFDMK FIRLKERRCG VRFDNPVLDT LLLSVFLHDH 
TADHTLEAIA ARLGVEVTAQ HTAWGDALVT ARVFACLLPL LRERGVHTLR DAVAASERMV 
EVRRQQAQF