Gene Mlg_1529 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1529
Symbol
ID	4270534
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	1742504
End bp	1744021
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	58%
IMG OID	638126287
Product	integrase catalytic subunit
Protein accession	YP_742368
Protein GI	114320685
COG category	[L] Replication, recombination and repair
COG ID	[COG2801] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.544255
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATTCGT ATGAAGACCG GATGAGAGCC GTGAAGCTCT ACATCCAGTA CCACAGGAGT 
GCCGCCGCCA CCGTCCGAGA GCTCGGCTAC CCCTCGAAGA AAAACCTGCG CCGTTGGCAT 
GAAGCCTACA TGAGAACCGG GGACCTGCCG GAGCGCAGTG CTCCTAAGCC GAAGTACTCG 
CCGGAACAGA AGCAAAAGGC TGTGCAGCAC TACCTGGGCC ATGGTTGCTG TCTCGCAAGG 
ACCCGAAAGG CCCTGGGTTA TCCAAGCGTG GGCGTTCTAC GTGAGTGGGT CATGGAGCAG 
AACCCCGGGC GGCGGCAGGT CTCAGCCGGC AGCTCAAAAG GTCCACCGCT CTCACCTGAG 
GCGAAACGTG AGGCGGTCAT TGAACTGTGT TCCCGCCAAG ATCCCGCCAC GAAGGTTGCC 
AAAAACCTGG GCGTTAGCAG GCAGGTTCTG TACAAGTGGA CAGACCAGTT GCTTGGTGAT 
GAGGCCAATC CACGGATGAA ACGACGCGAT GATGAGGTGT TGCCGCTGGA GCAGGAAGTT 
AAAGAGCTGC AAAGGCGCGT CCATCGACTC CAGCTCGAGC ACGATCTTCT GGCGAAGGCG 
AACGACCTGA TAAAAAAGGA TCTTGGCGTC GACCTCCGGC TCCTGACGAA CAGGGAGAAG 
ACCCTGCTGG TTGACGCCCT GAGACAGACT TATCGGCTCT CGGAAATCTT GTCGCAACTG 
TGCCTGCCGC GCAGTTCCTA TTTCTACCAT CGGGCAAGGA TCCAGCTACC TGACAAGTAT 
GCAACCGTTC GCGTGAGCGC GACCCAACTC TTCGAGACCA ACCACCGCTG CTACGGTTAC 
CGGCGCATAC GGGTTGCTCT CAACCGACTT GGCATCGTGA TCTCTGAGAA GGTAGTCCGG 
CGCCTTATGG CTGAGGAACA GCTCATCGTC CAAAGGCGCA AGTGTCGACG GTACAGGTCG 
TACCGCGGAG AAATCACTCC GGCCCCCGAG AATCTGGTCA ATCGGGATTT CAGCGCCCCT 
GCGCCCAACC GCAAGTGGCT GACGGATATC ACGGAGTTCC AAATCCCTGC AGGCAAGGTT 
TACCTCTCTC CAGTGATCGA CTGCTTCGAT GGGTTGGCGG TGAGCTGGAC TATAAGCACA 
AGCCCCGATG CCACCCTGGT AAACACGATG CTTGATGACG CCATAGCAAC GCTGGAGGAC 
GGCGAGACAC CTATTATCCA CAGCGATAGA GGAGCTCATT ACCGCTGGCC CGGATGGCTT 
GCCCGCATCC AAGATGTCGG CCTTATCCGG TCGATGTCGC GCAAAGGCTG TTCGCCGGAC 
AATGCCGCCT GTGAGGGCTT CTTCGGGCGA CTCAAGACCG AGTTCTTCTA CCCACGCGAC 
TGGCACGGGA TAACACTTGA GCAATTCTTC GAAGAGCTCG ACGAGTATAT CCGGTGGCAC 
AACCGAAACA GGGTTAAGCT GTCCTTGGGA GGCCAGAGCC CGCTCGAGTA TCGAGAGCGC 
TTAGGACTGG CCGCATGA

Protein sequence

MYSYEDRMRA VKLYIQYHRS AAATVRELGY PSKKNLRRWH EAYMRTGDLP ERSAPKPKYS 
PEQKQKAVQH YLGHGCCLAR TRKALGYPSV GVLREWVMEQ NPGRRQVSAG SSKGPPLSPE 
AKREAVIELC SRQDPATKVA KNLGVSRQVL YKWTDQLLGD EANPRMKRRD DEVLPLEQEV 
KELQRRVHRL QLEHDLLAKA NDLIKKDLGV DLRLLTNREK TLLVDALRQT YRLSEILSQL 
CLPRSSYFYH RARIQLPDKY ATVRVSATQL FETNHRCYGY RRIRVALNRL GIVISEKVVR 
RLMAEEQLIV QRRKCRRYRS YRGEITPAPE NLVNRDFSAP APNRKWLTDI TEFQIPAGKV 
YLSPVIDCFD GLAVSWTIST SPDATLVNTM LDDAIATLED GETPIIHSDR GAHYRWPGWL 
ARIQDVGLIR SMSRKGCSPD NAACEGFFGR LKTEFFYPRD WHGITLEQFF EELDEYIRWH 
NRNRVKLSLG GQSPLEYRER LGLAA