Gene Mlg_1203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1203
Symbol
ID	4270691
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	1401958
End bp	1402890
Gene Length	933 bp
Protein Length	310 aa
Translation table	11
GC content	68%
IMG OID	638125952
Product	hypothetical protein
Protein accession	YP_742042
Protein GI	114320359
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1463] ABC-type transport system involved in resistance to organic solvents, periplasmic component
TIGRFAM ID	[TIGR00996] virulence factor Mce family protein

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.511791
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.098201
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAACCC GCGTGAGCTA CGCCCTGGTT GGGCTGTTCG TCATCCTGCT CACCCTGGCC 
ATCATCGGCG CCGGGCTCTA TCTCGGTGGC GACATCCGGA CCCAGCCTCA TACCGACTAT 
GCCGTCTACA TGGATGAGTC GGTGGCCGGG CTCAATGTCA GCGCCCCCGT TCGTTACCGC 
GGCGTGGACG TGGGCCGGGT CCAGGCCATC ACCCTCAACC CCCGGCATCC GGACGAGGTC 
CGCATCGTCA TCTCCGTCGA GGAGCGGGTC CCCATCGGCC GGGAGACCGT GGCCACGCTC 
CGTTCCCAGG GGTTGACCGG GATCTCCTTC ATCGAGCTTA GTGGCAGCAC CACCGACCCC 
GTCACGCCGC AACCGCGCGC CGGCGATGAC CTGCCCGCCC TCCGCACCGT CCCCTCCTTC 
GGCAGCCGCC TGGAGCAGAC GGTGGACGAG GCTTTGGGTG TGATGCGGGT GGTGGCCGAC 
GAGGTGCGCG ACCTCCTGCG CGAGGAGAAT CGCGAGCGCG TGGCCCGGCT GCTCCAGAAC 
GCCAACGTGC TGGTCGCCAA CCTGGCCGAG GGCAGCGAGG ACCTGGACCA GACCATGGTT 
CGGTTCAACC AACTGCTCGA CCAGGGCAAT GAGGCCGCCG CGCGGCTGCC GGAGAGCATG 
GACCGGCTCG ACGACACCCT GGCGCGCTGG GCGCGGCTGG CCGACGACCT GGGCCGGACC 
GGTGACACCC TGGACGCCCT GGCCAGCCGG GGCGAGACCA CCCTTATCGA TGTCAATCAG 
ACCCTGATCC CCGAACTGGG CACCCTGATG TACGAGATGC GCCGGTTGTC ACAGGATCTG 
GAACGGACCC TGGAGGACTT CAGCGACGAG CCGCAGATGC TGATCTACGG CCGCCAACCC 
ATCGCCCCGG GCCCCGGAGA GGAGACGCGC TGA

Protein sequence

METRVSYALV GLFVILLTLA IIGAGLYLGG DIRTQPHTDY AVYMDESVAG LNVSAPVRYR 
GVDVGRVQAI TLNPRHPDEV RIVISVEERV PIGRETVATL RSQGLTGISF IELSGSTTDP 
VTPQPRAGDD LPALRTVPSF GSRLEQTVDE ALGVMRVVAD EVRDLLREEN RERVARLLQN 
ANVLVANLAE GSEDLDQTMV RFNQLLDQGN EAAARLPESM DRLDDTLARW ARLADDLGRT 
GDTLDALASR GETTLIDVNQ TLIPELGTLM YEMRRLSQDL ERTLEDFSDE PQMLIYGRQP 
IAPGPGEETR