Gene Mlg_1783 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1783
Symbol
ID	4269169
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2036728
End bp	2038320
Gene Length	1593 bp
Protein Length	530 aa
Translation table	11
GC content	67%
IMG OID	638126539
Product	transposase IS66
Protein accession	YP_742617
Protein GI	114320934
COG category	[L] Replication, recombination and repair
COG ID	[COG3436] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATCAG CGGCCATTCA ACCATATAGG GATGTCTCCC GCCTACAGCG GCAGGTCGCT 
GAGCTGGAGA AAAAGCTCGC CGAAACAGAC GCCCTGTTGG CCACCAAGGA GGCCCACTGG 
GCTGCCCGCG AGCGCTCCAT GTTCGAGCAG ATCCGGCTGC TGCTCGACAG CCGCTTCGGC 
CCCTCCACCG AACGCTACCA CGTCGATCAG CAGCAACTGC AGTTCGACGA GGCCGAGCAG 
TATGCCGATG CACCGGTCAC CGAACCGGAG GCAGAGGCCG CTCAAGCCGG CGAGACGGCC 
CCGAGCGTGC CGGCCAAGCG CCGGAACCGT GGCGGCCGCG TGCGGCTGCC CGCGGAACTG 
CCGCGGGTCG AGGTGGTGCA CGATATCCCC GAGGCACAGC GCTACTGCCC GCATGACGGC 
AGCGAGCTGA CCTGCATCGG TGAAGAGGTC ACCGAGCAAC TGGATGTCAT CCCCGCCCGG 
GTGCAGGTCC GCCGCCACAT CCGGCGCAAG TACGCCTGCA GATGCTGCGA AGAAGGCGTG 
CACACCGCAA GCATGCCGCC GCAACCGCTG CCCCGGAGCA TGGCCAGCCC CGGATTGCTG 
GCCTACATCG CCACCGCCAA GTACGAATTC GGCCTGCCGC TCTACCGCCA GGCCAAGGGC 
TTCGAGCGCA AGGGCATCCC GCTGCCGCGT AACACCCTGG CGCGCTGGAT GGTGGGCATC 
GGCGAGCTGC TCACCCCGCT GGGGCAGGCC CTGCAGGACC ATCTACTGGC CCAGCCGCTC 
ATCCACATGG ATGAGACCAC GGTCCAGGTG AACACCGAGC CGGGGCGAAC GGCCTCCAGC 
ACCTCCTACA TGTGGGTCCA GCGCGGTGGC CCGCCCGGTG AGCAGGTGGT GCGCTACGAC 
TACGACACCA GCCGCTCCGG CCGGGTCCCC CAGCGCCTGC TCGGCGACTA TGCCGGCGTG 
CTGGTCACCG ACGGCTACGA GGGCTATGCC CAGGTGGTGC GGGAGAATGG CATCACCCAT 
GCCGGCTGCT GGGCGCATGC CCGGCGGAAG TTTGTCGAGG CCCAGAAGGT CCAGCCCAAG 
GGCAAGACCG GCAAGGCCGA CTGGGCGCTG AGCCTGATCG GCAAGCTTTA CCGCGTCGAG 
CGCGAAGGCA AAACCCTGGA CCCGGAGGCT CGTCTGGTGC TGCGTCAGCG CCAGAGCCGG 
CCGCTGATCG ACAAACTCCA GCGCTGGCTG GAGAAGTCCA TCACCCAGGT GCCGCCGAAG 
ACCGCCATCG GCAAAGCGCT GCGCTATCTT CAGGGCCAGT GGTCCCGGCT GACCCGCTTT 
CTCGATGATG GGCGCATCCC GCTGGATAAC AATCCGGCGG AGAACGCCAT CCGACCCTTC 
GTGGTGGGCC GAAAGAACTG GCTATTCAGT CACACCACCC AGGGCGCGGC GGCCAGCGCG 
ATGATCTACA GCGTGATAGA GACGGCCAAG GCCAACGGGC TGGAGCCCTA CGAGTATCTG 
GAAGATGTCC TCACCCGCCT GCCGGCTGCG GACACCAACC AGGCGGTTCA CGCTCTGCTG 
CCCTGGAACT GGGGTAAGAC CATACAGGCC TGA

Protein sequence

MKSAAIQPYR DVSRLQRQVA ELEKKLAETD ALLATKEAHW AARERSMFEQ IRLLLDSRFG 
PSTERYHVDQ QQLQFDEAEQ YADAPVTEPE AEAAQAGETA PSVPAKRRNR GGRVRLPAEL 
PRVEVVHDIP EAQRYCPHDG SELTCIGEEV TEQLDVIPAR VQVRRHIRRK YACRCCEEGV 
HTASMPPQPL PRSMASPGLL AYIATAKYEF GLPLYRQAKG FERKGIPLPR NTLARWMVGI 
GELLTPLGQA LQDHLLAQPL IHMDETTVQV NTEPGRTASS TSYMWVQRGG PPGEQVVRYD 
YDTSRSGRVP QRLLGDYAGV LVTDGYEGYA QVVRENGITH AGCWAHARRK FVEAQKVQPK 
GKTGKADWAL SLIGKLYRVE REGKTLDPEA RLVLRQRQSR PLIDKLQRWL EKSITQVPPK 
TAIGKALRYL QGQWSRLTRF LDDGRIPLDN NPAENAIRPF VVGRKNWLFS HTTQGAAASA 
MIYSVIETAK ANGLEPYEYL EDVLTRLPAA DTNQAVHALL PWNWGKTIQA