Gene Mlg_2831 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2831
Symbol
ID	4270875
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	3214889
End bp	3215977
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	71%
IMG OID	638127593
Product	OmpA/MotB domain-containing protein
Protein accession	YP_743661
Protein GI	114321978
COG category	[N] Cell motility
COG ID	[COG1360] Flagellar motor protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.227134
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTGAGG ACACCCGCCG CCGACGCCGG GGGCTGAACA TCTGGCCGGG CTACGTGGAC 
GCCCTGGCCA CCCTGCTGCT GCTGTTCGTC TTCGTGCTGT CGCTGTTCAT GGTGGCCCAG 
TACGTCCTCA GCGACGCCCT GTCCGGGCGC GAGGCGGCGT TGGCACGGCT GCAGGCCGAT 
ATCGACGCCC TCACCGAGAT CATCGCCCTG GAACGGGAGG AGCGTGCCGG GGTGGAGGAG 
GAGCTGGCCG AGCTGGAGGC CCGGCTGGTC GCCACCCTCG CCGAGCGCGA TCAGGCACGC 
GCCCGGGTCA GCACCCTGGA GGCACAGCAG GCCGCCCTCG AGGACAGTCT GGCCGATCAG 
GAGGAGGCCC TGGACGAGGC GGCGGCGCGC CGCGCGGAGC TTCGGGACCG GCTGGCCGGC 
CGCGAGGCGG ACCTGGCCCG CGAGCGCGCC CTCACCGACG AACAGGCCGC CCGCATCGAC 
CGGCTGCACC GGCAGATCAT CGCCCTGAGA GAGCAGCTCA CCGCCCTGTC CGAGGCACTC 
GACCTCAGCG AGGCCACCGC CGCGGCCCAG CGCGCCGAGA TCCGCGATCT CGGCCAGCGC 
CTCAATCTGG CGCTGGCGGA GCGGGTGCAG GAACTGGCCC GCTATCGCTC GGAGTTCTTT 
GGTCGGCTGC GCGAGGTACT GGGTGATCAC CCGGACATCC GGATTGAGGG CGACCGCTTT 
CTGTTCCAGT CCGAGCTGCT GTTCGCTACC GCCTCGGCGG ATCTCGGTGG CGAGGGCCGG 
GAGCAGCTCG AGGGGCTGGC CACCACCCTG CACGAATTGC GCGGGCGCAT CCCGGACGAC 
CTGGACTGGG TCCTGCAAGT GGAGGGCCAC ACCGATCGCC GCCCCATCCG CACCGCCGAG 
TTCCCGTCCA ACTGGGAGCT CTCCACCGCC CGCGCCCAGA CCATCGTGCG CTACCTGATG 
GACCAGGGCA TCCCGCCGGA ACGGCTGGCC GCCGCCGGCT TCGCCGAATA CCATCCGGTG 
GACGACCGCG ACACCCCGGA GGCCTGGGCC CGCAACCGGC GCATCGAACT GCGATTGACC 
AACCGCTAG

Protein sequence

MLEDTRRRRR GLNIWPGYVD ALATLLLLFV FVLSLFMVAQ YVLSDALSGR EAALARLQAD 
IDALTEIIAL EREERAGVEE ELAELEARLV ATLAERDQAR ARVSTLEAQQ AALEDSLADQ 
EEALDEAAAR RAELRDRLAG READLARERA LTDEQAARID RLHRQIIALR EQLTALSEAL 
DLSEATAAAQ RAEIRDLGQR LNLALAERVQ ELARYRSEFF GRLREVLGDH PDIRIEGDRF 
LFQSELLFAT ASADLGGEGR EQLEGLATTL HELRGRIPDD LDWVLQVEGH TDRRPIRTAE 
FPSNWELSTA RAQTIVRYLM DQGIPPERLA AAGFAEYHPV DDRDTPEAWA RNRRIELRLT 
NR