Gene Mlg_1791 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1791
Symbol
ID	4268710
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2045005
End bp	2046264
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	51%
IMG OID	638126547
Product	restriction modification system DNA specificity subunit
Protein accession	YP_742625
Protein GI	114320942
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.365715
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGACG TAACACTTCC AGCGACATGG TCAAGCAAGC GCCTCAAATA CCTAGCTACC 
TATAATGATG AGGTCTTACC AGAAAGCACT GATGAAGAGG CCGAGATCGA CTACGTTGAG 
ATCTCAGGTG TTTCCCTATC TCGTGGAGTT GAGCAGGTAG AGCGTATTAC TTTCGGGAAG 
GCTCCCTCTC GTGCTCGTCG TAAAGTGCGA AGCGGCGACA TATTGATTTC TACAGTTCGG 
ACTTACCTCA GGGCCATTGC CAAGGTTGAC GAAGCTTCGC CAGACCTGAT TGCTTCGACA 
GGTTTTTGTG TTGTTCGACC AGACAGGGAA GAAGTCGATA GTGGATACCT CGGTTGGGCC 
GCGAAATCTG AGCCGTTTGT ATCGGAGGTT GTTTCGCGCT CGGTCGGGGT CAGCTATCCG 
GCGATTAACG CTAGTGAGCT GGTCACTATC GAAATGCCGC TCCCACCCCT CGAAACCCAG 
CGCCGCATCG CGCAGTTTCT GGATGAGAAG ACCGCCCGCA TCGATGGCCT GATCGAGAAA 
AAGCGCGCCC TGTTGGACCG GCTGGCGGAA AAGCGCCAGG CCCTGATCAC CCGCGCCGTC 
ACCAAGGGCC TTAACCCCGA AGCCCCCATG AAACCCTCCG GCATCGACTG GCTGGGTGAT 
ATTCCTGCGC ATTGGGATCT GGTTCCATTC AAATGGAGAT GCCAAGTACA AAGTGGGCAA 
GTCGATCCTC GCGAGCCTGA GTATACAGAT ATGCCTTTAA TTGCTCCCGA CTATATAGAA 
AGCGGTACTG GACGACTATA CGATGTCCCT AGTGCCGAGG AACAGGGAGC AATTAGCGGG 
AAATACTTCT GCTCTGAGGG CTCTGTTCTA TACTCAAAGA TTCGCCCTGC ACTCAGAAAG 
GTTGCGTTAT TTGATTCAGT GTGTCTTTGC AGTGCAGATA TGTACGCTAT TGACCCCGGG 
AAGTATTTTG AACGTCGGTA CTTATTTTAT TTTCTTCTAA CTGATGCGTT TACGGCTTAT 
GCCGAGCTTG AGTCACTTCG CGTTGCGATG CCTAAAGTAA ATCGAGAAGC GCTTGGTGCG 
TTTGTGTTAC CAATTCCCTT TCTAGATGAG CAAACTGAGA TTGCCGACTA TTGTTCACGT 
GTAGATCGAG AGAATCGCTT CGCTGCAGAT GAAGTAAAGC GTAGTGTCCA GAAGCTAGAA 
GAATATCGCT CTGCACTAAT TACCGCTGCC GTCACTGGCC AAATCGGAGG TCTGCAATGA

Protein sequence

MIDVTLPATW SSKRLKYLAT YNDEVLPEST DEEAEIDYVE ISGVSLSRGV EQVERITFGK 
APSRARRKVR SGDILISTVR TYLRAIAKVD EASPDLIAST GFCVVRPDRE EVDSGYLGWA 
AKSEPFVSEV VSRSVGVSYP AINASELVTI EMPLPPLETQ RRIAQFLDEK TARIDGLIEK 
KRALLDRLAE KRQALITRAV TKGLNPEAPM KPSGIDWLGD IPAHWDLVPF KWRCQVQSGQ 
VDPREPEYTD MPLIAPDYIE SGTGRLYDVP SAEEQGAISG KYFCSEGSVL YSKIRPALRK 
VALFDSVCLC SADMYAIDPG KYFERRYLFY FLLTDAFTAY AELESLRVAM PKVNREALGA 
FVLPIPFLDE QTEIADYCSR VDRENRFAAD EVKRSVQKLE EYRSALITAA VTGQIGGLQ