Gene Mlg_0048 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0048
Symbol
ID	4270917
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	51556
End bp	53319
Gene Length	1764 bp
Protein Length	587 aa
Translation table	11
GC content	66%
IMG OID	638124773
Product	hypothetical protein
Protein accession	YP_740895
Protein GI	114319212
COG category	[S] Function unknown
COG ID	[COG3519] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR03359] type VI secretion protein, VC_A0110 family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGAACC GCTACTACCG GGACGAACTC AACTTCCTTC GCCAGGAGGG CAGGGCGTTC 
GCTCAGGCGT ATCCGCACCT CAGCCGTTTC CTCTCGGAGC CGGGGGACGA CCCGGACGTG 
GAGCGGTTGC TGGAGGGCTT CGCCTTCCTC ACCGGACGCA TGCGCGAGAA GGTGGAGGAT 
GAGTTCCCGG AGCTCACCCA CTCGCTCATT AGCATGCTCT GGCCCAACTA TCTGCGTCCG 
GTCCCGAGCA TGACCATTGT CCGTTTCGAT CCCCGGTGGC ATGCGTTGCG TGCCGGGCAC 
CGGCTGCCGC GCGGCACCGC GCTGCGGAGC CAGCCGGTAC AGGGTACCCC CTGCCGATTC 
CGGACCAGTC ACGACGTCAC CCTGTATCCG TTGGAGGTGG CCGGTGTTGA CACCGCCCGT 
TCACGCAGCC GGTCCCAGGT GACGTTACGG CTTGCCGTGC ACAGTGATCA GCCGCTCGCG 
GACCTGCCGG CCGATCCGCT GCGTTTCTAT CTTGGCGGTG ACGGCTATAC GGCGCGCACG 
CTCTATCTCT GGCTGCAGCA TTATCTGGAG GGCGTGGATC TGGAGGTGGC CGGCGAGCGT 
CGCAGCCTGC CGGCGGACGC TATCAGTCCG GTCGGCTTCG AGCGTGATCA GTCCCTGCTG 
CCCTACCCGC GCAATAGTTT TCAAGGGTAT CGCATCCTCC AGGAATACCT CTGTGTCCCG 
GACGCATTCC GTTTCCTTGA CTTGCAGCGC TTGTCTGCCG CCCTGCCCCA CGAGGCGGCC 
GACGAGATCC GGCTGGTGTT CCGTTTCTCA CGCACCCTGC CGAGGGATGC CCGCCTGTCG 
GTGGACCACT TCCAGCTCCA TTGCACCCCG GCGGTCAACC TCTTCGAGCA GGACGCCGAC 
CCGATTGACC TGACCGGCGA GCGTGCCGAG TACCCGATCC TGCCCAGTAG CCGTAACCCC 
GCCCACTACG AGGTCTATAG TGTCGATGCG GTGGAAGGGT GGCTCACCAC GGGCAGCGGC 
CGGTTCCGCG GCGAGCCCCG CCGTTATGTG CCCTTCGAGA GCTTCCAGCA CCAGCTCGAG 
CGCGACCGTG GAGGGGATGC GCGCTACTAC CGGCTCCGCG TACGGGAGAG CGTGCGCGAC 
GACGGCTTCG CCCACGATAT CGCCTTCGTA CGGGAGGACG AGGTCTACCG GTTGGCGCAC 
CATGAGACCG TCTCCTTGCG CCTGACCTGC ACCAACCGGC GGTTGCCCGA ATCCCTGGGC 
GTGGGTGACA TCACCGACTT TGCCGACGAC AGCCCCGCCC TGGTCACGGC CCGCAACATC 
ACCCGGCCCA CCCCTGCCCT CAGGCCGCAA CTGGACGGCG GCCTGCTGTG GACGCTGATC 
TCCAATCTCG CCCTGAACTA TCTCTCGCTG TTGCATACCG ACGCGCTCCG TTCGGTCCTG 
CGGGCCTACG ATTTTCGCGC GTTGGTGGAC CGTCAGGCCG AGCGCGCCTC GCAGCAACGC 
CTGGCGGGCA TACGGGCCAT CGACACCGTG CCGGTGGATC GTTTGCACCA CGGCCTGCCG 
GTGCGCGGGA TGCGCTCGGT GGTAACGTTG GACGAAGCCG CCTTCGGTGA CGAGGGCGGG 
CTCTACCAGT TCGGCTGCGT GCTGGCGCGC TTTCTGGCGC TGTACGCCAG CATCAACGCC 
TTTCACGAGC TGCAGGTCGT CAATCTCAGA AACCAGGAGC GCTACACATG GAAGTGGCAG 
CCCGGTCAGC AACCGCTGAT GTGA

Protein sequence

MLNRYYRDEL NFLRQEGRAF AQAYPHLSRF LSEPGDDPDV ERLLEGFAFL TGRMREKVED 
EFPELTHSLI SMLWPNYLRP VPSMTIVRFD PRWHALRAGH RLPRGTALRS QPVQGTPCRF 
RTSHDVTLYP LEVAGVDTAR SRSRSQVTLR LAVHSDQPLA DLPADPLRFY LGGDGYTART 
LYLWLQHYLE GVDLEVAGER RSLPADAISP VGFERDQSLL PYPRNSFQGY RILQEYLCVP 
DAFRFLDLQR LSAALPHEAA DEIRLVFRFS RTLPRDARLS VDHFQLHCTP AVNLFEQDAD 
PIDLTGERAE YPILPSSRNP AHYEVYSVDA VEGWLTTGSG RFRGEPRRYV PFESFQHQLE 
RDRGGDARYY RLRVRESVRD DGFAHDIAFV REDEVYRLAH HETVSLRLTC TNRRLPESLG 
VGDITDFADD SPALVTARNI TRPTPALRPQ LDGGLLWTLI SNLALNYLSL LHTDALRSVL 
RAYDFRALVD RQAERASQQR LAGIRAIDTV PVDRLHHGLP VRGMRSVVTL DEAAFGDEGG 
LYQFGCVLAR FLALYASINA FHELQVVNLR NQERYTWKWQ PGQQPLM