Gene Mlg_0049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0049
Symbol
ID	4270918
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	53316
End bp	54302
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	67%
IMG OID	638124774
Product	hypothetical protein
Protein accession	YP_740896
Protein GI	114319213
COG category	[S] Function unknown
COG ID	[COG3520] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR03347] type VI secretion protein, VC_A0111 family

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCCCGG GGCATCTCGC CACCCGCGCC CGGCACTACG ATTTCTATCA GCTGGTGGAA 
CTGCTCTTCC AGCAATGGGG CTGGCAGCCG GAAGCGGGGA GCGGAAGCGG TCCCCAGGTG 
GAAGGGGTGC GCTTCCGGGC CTCCGCGTCG CTGGGTTTTC CCGGCACCGA CGTGGTGGCG 
CTGCGGCCCT GCCCGCGGGA GGGCCATATC CTCGAGGTCA GTTTTCTCGG GCTGCACGGC 
GCCCAGTCCC CGCTCCCTGG TTACTACCTG GAGCACTTGG CGCACGCCAG TGCTCACGGT 
GAGGGGGCGG CCGTTGACCT GCTGAATTTC TTCCACCACC GGTTATTGAC CCTGCTCCAT 
TTCGCCTGGC GCAAGTATCG CCACTACGTG CGTTACCAAG ACGGGGCGCG CGACGGCTTC 
TCGGCGGCGT TGTTCGCCTT GAGCGGGCTG GCGGACAAGG ACCTGCGGGC GGAAAGCCCG 
ATCAACTGGA GCAAGCTGCT GGCGTACGCC GGCCTGGTGG CGGGGCGGTC ACGCTCGCCC 
GAGGTGGTGG GCGGCATCCT CGCTCATTGC TTCGACCTGG AGGAGGTGGC GATCGTGCCC 
TGGCAGGCGC GGTGGGTGGC GGTGCCCGAC GACCAGCGCA GCCGGTGCGG CACGGCCTGT 
ATGAGCCTGA ACCGCGATCT CACCATTGGC GACCGGGTGG TGGACATCAA CGGCAAGTTC 
CTGATCCGCA TTGGCCGGTT GTCCCGTCGC CGGATGGCGG ATTTTCTCCC GGATGGGCGG 
GATTTCGCTC CGCTAAAGGC CGTGGTCGAT TTCCTGTTGC GCGAGCCCCT GGCCTACGAC 
CTGGAGTTGG AGCTGATGAG CGACCAGGTC CGGCCGATGC GTCTCTCCGC GCGGGACCCC 
GAGCGACTGG GCTGGACGAC CTTTCTTGAT CCACGAACCG ATGCCATGCG CCGCCAGCGG 
CGCGTGCGCC TGCAGATAAG GGGGTAA

Protein sequence

MSPGHLATRA RHYDFYQLVE LLFQQWGWQP EAGSGSGPQV EGVRFRASAS LGFPGTDVVA 
LRPCPREGHI LEVSFLGLHG AQSPLPGYYL EHLAHASAHG EGAAVDLLNF FHHRLLTLLH 
FAWRKYRHYV RYQDGARDGF SAALFALSGL ADKDLRAESP INWSKLLAYA GLVAGRSRSP 
EVVGGILAHC FDLEEVAIVP WQARWVAVPD DQRSRCGTAC MSLNRDLTIG DRVVDINGKF 
LIRIGRLSRR RMADFLPDGR DFAPLKAVVD FLLREPLAYD LELELMSDQV RPMRLSARDP 
ERLGWTTFLD PRTDAMRRQR RVRLQIRG