Gene Mlg_1954 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1954
Symbol
ID	4268123
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	2223384
End bp	2224601
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	64%
IMG OID	638126709
Product	hypothetical protein
Protein accession	YP_742786
Protein GI	114321103
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0562969
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.072351
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCGTA AACTGACCTG CTATTGCAGC GCGGCGGCGC TGGCTGCCGG TGCGTCGCTC 
TCCGGCGCGG TGATGGCCGA CGAGGCCCGG ATTGCCGAAC TCGAGGAGCG TATCGAGGCG 
CTGGAGGCGA GTCCGGCCAC CGGCGACGGC ATCCGGTTCG GGGGCGCGCT GCGCTTCAAC 
GTCCGTTACG ACGACACCGA CGCCGGCTCC GCCATCCGCG ACCGCGGCGG CGATATCAAC 
CTGGACACCT TCCGCGTCAA CGTGGACGGC CGCCAGGATC GGGTGACCTT TGCCGCCGAG 
TATCGCTGGT ATCCGGACTT CGACCAGCAC TTCCTGCACA CCGGCTGGGT GGGCTACGAC 
TTCACCGACA CCACCACGGC CCGGATTGGT CAGCAGCGTG CCGCCTTCGG CCTGCAGCCC 
TACCAATCCA ACAACTTCTG GTTCAGCAGC AACTACTATG TCGGGCTGGA GGACAAGCTA 
GCCATCGGCA TCAACGTAGA CCATGAGCAG GGCCCGCTGA AGCTGGACCT GGGCTTCTTC 
AGCAACCCGG CCTCCGGCAG CGCCGGCAGC TCCGGGCACT ACTCCACCGA GGTGGCCCCG 
GCCGCTGACT GTGGCGCCGG TGCCGACGCC GGGTTGTGCA ACGAGGAGAT GAACCAACTC 
TACGCCCGCG CCGCCTACAC CTTCGACCAT GGACCGGACG CCGCCACTGA GTTCGGCATC 
TCCGGCATGG CCGGCAAACT GCGCAACACC CTGACCGGTG ACCGCGGTGA CAGCTGGGCG 
GCGGCCGCGC ACCTCAACGG CCAGTATCAG CGCTGGAATG TCATGGCCCA GTTTGCCTCT 
TACGAGCATG ATCCGCGCAA CCCGGACGGG GCCAACGACG ACATCATCAA CATGAGCATC 
CAGGGCTTTA CCGGCTTTGG GACCCCGTCA GAGGCGGACA CCTTTATCCT GAATGTCGCC 
TACGACCTGC CGGTCAGCTT CGGCCCGGTG AGCAACCTGC GCTTCTACAA CGACTACTCC 
ACGGTGCGGA GCAAGTCCGA CAGCTCCCGC AACACGGAGC AGAACGTCAC CGGGATGTCC 
ATCACCGCGG GTAACATCTT CACCTACGTG GACATCATCC GTGGCAAGAA CCAGCCCTTT 
GTCGGCGGCC AGACCATGGT CGGTGATGAC GGCAGCTGGG AGACCCTGTA CAACATCAAC 
ATCGGCTACT ATTTCTGA

Protein sequence

MMRKLTCYCS AAALAAGASL SGAVMADEAR IAELEERIEA LEASPATGDG IRFGGALRFN 
VRYDDTDAGS AIRDRGGDIN LDTFRVNVDG RQDRVTFAAE YRWYPDFDQH FLHTGWVGYD 
FTDTTTARIG QQRAAFGLQP YQSNNFWFSS NYYVGLEDKL AIGINVDHEQ GPLKLDLGFF 
SNPASGSAGS SGHYSTEVAP AADCGAGADA GLCNEEMNQL YARAAYTFDH GPDAATEFGI 
SGMAGKLRNT LTGDRGDSWA AAAHLNGQYQ RWNVMAQFAS YEHDPRNPDG ANDDIINMSI 
QGFTGFGTPS EADTFILNVA YDLPVSFGPV SNLRFYNDYS TVRSKSDSSR NTEQNVTGMS 
ITAGNIFTYV DIIRGKNQPF VGGQTMVGDD GSWETLYNIN IGYYF