Gene Mlg_2703 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2703
Symbol
ID	4269947
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	3068793
End bp	3070124
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	68%
IMG OID	638127464
Product	hypothetical protein
Protein accession	YP_743533
Protein GI	114321850
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAGGAGG GGACCCCCAT GGAGCAGACG TCCGCCGCCC GCCAGCCGTC GGAACAGGCA 
GCCCGGCTGA GCGTCTGGGT GCTACTGCTG CTCGGGGCCC TCCTGCTGCA GCAACCCGTA 
CCGAGTGCAC AGGCCGCTGA GAACGGCCCC GCCGGGGCGG ACACCATCAC CCTGCATTTC 
TTCTGGACCC AGCAGTGCCC CCGCTGCATT GCCGCCCTGC CCGCCGTCCG CCGGCTGGCC 
GAGGACTACG ACTGGCTGGA GGTGCGCAGC TACAACCTCA GCGCGGAGCC ACGGCACGGC 
CAGGTCTACC GGGAACTGGC CAGCGCCCTG GGCGAGGAGG CCCGGGCGGT GCCGGGGTTT 
GTCTTCTGCG ACGCCATGCT GGTGGGCTTC GATGACCACG GCCGGCAGGA GGCGCGATTG 
CGCCAGTTGC TGGAGACCTG TCATGCGCAG ATCCAGGCCG GCGGGCCGCC GGTGCTGGAG 
CGTGCCCTTT GGACCGAGGC GGAACCCATG CGGTTGCCGC TGCTCGGCGA GGTGCGGCCG 
GATGACCTCT CGCTGCCGGC ACTGACCCTC CTGCTGGCCG GGTTCGACGC CTTCAACCCC 
TGCGCCTTCT TCGTGCTGCT GTTCCTGCTC AGCGTGGTGG TGCACAGCCG CAGCCGCGGC 
CGTATCCTGC TGATTGGCGG CATCTTCGTG ACCATCTCCG GGGTCATTTA CTTCACCTTC 
ATGACCGCCT GGCTGAACGC CTTCCTGGTC TTTGGCGAGA TGCCGCTGGT GACCCGGCTG 
GCCGGGCTGG TGGCGGTGAC CATGGCGCTG ATCAACATCA AGGACTACTT CTGGTTCAAG 
CGCGGCGTGT CACTGAGCAT TCCGGACTCG GCCCGGCCGG GGCTGTTCCG GCGTATGCGC 
GCACTCACCA CCGCCGACAG TCTGCCCTGG GTGCTGGGGG CCACGCTGAT CCTCGCCGTG 
GTGGTGAACC TCTACGAGAT CCTCTGCACC ATGGGCTTCC CCATGATCTA CACCCGCATC 
CTCACCGCCC ACGACCCGGG CGCGGTGGGA TACTACGGCT ACCTGCTGGC CTACAACGTG 
ATCTACGTGC TTCCCATGCT CATCATCGTG GCGCTGTTCG CCTTCACCCT GGGCAATCGC 
AAGCTGCAGG AAGACGAGGG GCGGCTGCTG AAACTGCTCT CGGGGATGAT GATGCTGGGT 
CTGGGACTGA TGCTGCTGCT GCGTCCGGAC CTGCTGGCCA ACCCCCTGTT CGCCGTCGGC 
GTCATCTTCC TGGCCCTGCT GGCCACCGGG CTGGTCCGCC GTCTGTCCCC GCGAGGGTCA 
GGCGGTCGAT GA

Protein sequence

MQEGTPMEQT SAARQPSEQA ARLSVWVLLL LGALLLQQPV PSAQAAENGP AGADTITLHF 
FWTQQCPRCI AALPAVRRLA EDYDWLEVRS YNLSAEPRHG QVYRELASAL GEEARAVPGF 
VFCDAMLVGF DDHGRQEARL RQLLETCHAQ IQAGGPPVLE RALWTEAEPM RLPLLGEVRP 
DDLSLPALTL LLAGFDAFNP CAFFVLLFLL SVVVHSRSRG RILLIGGIFV TISGVIYFTF 
MTAWLNAFLV FGEMPLVTRL AGLVAVTMAL INIKDYFWFK RGVSLSIPDS ARPGLFRRMR 
ALTTADSLPW VLGATLILAV VVNLYEILCT MGFPMIYTRI LTAHDPGAVG YYGYLLAYNV 
IYVLPMLIIV ALFAFTLGNR KLQEDEGRLL KLLSGMMMLG LGLMLLLRPD LLANPLFAVG 
VIFLALLATG LVRRLSPRGS GGR