Gene Mlg_2080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2080
Symbol
ID	4269399
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	2358221
End bp	2359474
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	64%
IMG OID	638126836
Product	type II secretion system protein
Protein accession	YP_742912
Protein GI	114321229
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1459] Type II secretory pathway, component PulF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.917677
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.551071
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGTCG CCACCGCAAA GAAAGCCAGT CGCAAGAAGC CCAGGCAGCA ACCCGTGTTC 
AACTGGGAGG GCACCGACAA GCGCGGCGCC AAGGTCAAGG GCAGCATGCA CTCGGAGAAT 
GCCCTGGCGC TGAAGGCCGA GCTGCGCCGC CAGGGCATCA TCCCCTCCAA GGTGCGCAAG 
CGCTCCGCGC TGGAGGACCT GCTCAGCGGC GGCAACAAGA AGATCAAGCC GGCGGACATC 
GCCTATTTCA GCCGCCAGCT CGCCACCATG CTGCAGTCCG GCGTGCCGCT GGTTCAGGCC 
CTGGATATCG TCGGCAAGGG GGACGAGCAC GCCGGCATGC GCCAGCTCGT GGCGGAGATC 
AAGAACGATG TGGAGTCGGG CACGGCCCTG CACACCGCCC TACAGAAGCA CCCGCGCTAT 
TTCGATGACC TGTTCGTCAG TCTGGTGGCG GCCGGGGAGT CCGCGGGGGT GTTGGACACC 
CTGCTGGACA AGATCGCCAC CTACAAGGAA AAGACCGAGT CGATCAAGGG CAAGATCAAG 
AAGGCCCTGT TCTACCCCAC GGCGGTGATC GTGGTGGCCA TCGTGGTCAC CGCCATCCTG 
CTGATCTGGG TCGTGCCGCA GTTCGAGTCG CTGTTCCGCG GCTTCGGTGC CGACCTGCCG 
TTGTTCACCC AGATGGTGAT CAACCTGTCG GACTTCATGC AGAGCTACTG GTTCATCATG 
CTGGCCGCGG CCATCGGGCT GGGCTGGGGG TTCAGCACCG CCAAGCGACG ATCGAAGGCC 
TTCTCACGCA GCGTGGACCG GTTTTCGCTG AAGATCCCTG CCATCGGCAA CATCCTTTAC 
AAGGCCTCGG TGGCCCGCTT CGCCCGTACC CTCGCCACCA TGTTCGCCGC CGGGGTGCCC 
CTGGTGGAGG GGCTGCGCTC GGTGGCCAGT GCCACCGGCA ACTATGTGTT CGAGTCAGCG 
GTGCTGCAGA TTCGCGAGCA GGTGGCCGCC GGCCAGCAGC TGCAGATCTC CATGCGACTG 
TCCAATCTCT TCCCCAATAT GGCCATCCAA ATGGTGGCCA TCGGCGAGGA GTCCGGCTCG 
TTGGACAGCA TGCTCGCCAA GGTGGCCGAC TACTACGAGG AGGAGGTGGA CAACGCCATC 
GATAGCCTCA GCAGCCTGCT GGAGCCGATG ATCATGGCGA TCCTCGGCAT CCTGGTGGGC 
GGACTGGTCA TCGCCATGTA TCTGCCCATC TTCCAGATGG GCGCCGCCAT CTGA

Protein sequence

MAVATAKKAS RKKPRQQPVF NWEGTDKRGA KVKGSMHSEN ALALKAELRR QGIIPSKVRK 
RSALEDLLSG GNKKIKPADI AYFSRQLATM LQSGVPLVQA LDIVGKGDEH AGMRQLVAEI 
KNDVESGTAL HTALQKHPRY FDDLFVSLVA AGESAGVLDT LLDKIATYKE KTESIKGKIK 
KALFYPTAVI VVAIVVTAIL LIWVVPQFES LFRGFGADLP LFTQMVINLS DFMQSYWFIM 
LAAAIGLGWG FSTAKRRSKA FSRSVDRFSL KIPAIGNILY KASVARFART LATMFAAGVP 
LVEGLRSVAS ATGNYVFESA VLQIREQVAA GQQLQISMRL SNLFPNMAIQ MVAIGEESGS 
LDSMLAKVAD YYEEEVDNAI DSLSSLLEPM IMAILGILVG GLVIAMYLPI FQMGAAI