Gene Mlg_0052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0052
Symbol
ID	4270921
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	55586
End bp	56923
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	67%
IMG OID	638124777
Product	hypothetical protein
Protein accession	YP_740899
Protein GI	114319216
COG category	[S] Function unknown
COG ID	[COG3522] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR03353] type VI secretion protein, VC_A0114 family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.808473
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCTGCC GTAACCGAGT CGTTTGGCGT GAAGGGGCGT TCATCAAACC GCACCACTTC 
CAGCAACAAC AGCGCAGCCT CGAGGGGCTG CTGGACCTGC GGCTGCAGGC GGTCAGCGGC 
TACAGCCACG GCTTCCTGCA ACTGGAACTG AACAGCGAAT TCCTGGGCTT CGGCCGGATT 
GCGCTCACCC GGGCCCGCGG CATCATGCCG GACGGCACCG CCTTCGACCT GCCGGGCGAT 
GACCTGGAGC CACCACCACT GGCCGTGGAC GAGGCCGGCA TGGCCAACCA GCGGGTCTAC 
CTGGGGCTGC CCCTGGCCGG TGATGGCGTG GCCGAGGTCA GCGACGAGGA CGCCATCAGG 
GATGATGGCC GCTACCGCCT GCATCGCCGG GAGATCTGGG ATCTTCACAC CAGTCCTGGA 
GATGTCGCTG AACTGGCGGT GGCCCGCGCC GCCCCGCGCC TGCTGTTGGA GCACGATGAC 
CGCAGCGGTT ATGCCTGCCT GGCAGTGGCG CGGATACTGG AGCGGCGCCC GGATGGTTCA 
CTGGTACTCG ATCCCGACTT TATCCCCACC ACCCTGACCA CCCGGGTGGC GCCCGGCCTG 
CAGCGGTTCA TTGGTGAGGT GGCCGGGTTG ATGCAGGCGC GAGCGCGTCG GATCGCACAG 
CGGCTGGCCG CTCCGCAGCA GGCCGGGGTG GCTGATGTCT CCGACTTCAT GCTGCTGCAA 
TTGCTGAACC GCCTGCAGCC CCGGTTCCAG CACCTGCAAC AGCACCGGCG GCTGCACCCG 
GAGGCCCTCT ACAGCCACAT GCTGGAGGCC TGCAGCGAAC TGGCGACCTT CACCGACGAG 
TCGCGGTTGC CCCGGCGCTA TCCTCCCTAC GACCACGATG CCCCCGATAC CGCCTTCCGT 
GCGCTCATGC AGGGGCTCCG TCAGGCTCTC TCCACCGTGC TGGAGGCCCG AGCGGTGGCC 
ATTCCCCTGG AGGCCCGCCG TCACGGGCTC ATGCTCGCGC CGCTAAGCGA TTCGACGCTG 
CTGGACGAGG CCGAGTTCGT GGTCGCCGTG CGCGCGGACA TGGCGGTGGA GACGCTGCGC 
CGACAGTTCA TCCAGCAGAC GAAGATCGCC GGTATCGAAC GCATCCGCGA CCTGGTCAGT 
CTGCAACTGC CCGGCATTCC GCTCGTTCCG CTGCCGGTCG CGCCGCGCCA GCTCCCCTAT 
CACGCGAGTC ATATCTACTT CCAGCTCGAC CGTCGCAGCG AGGCCTGGGG CCTGCTGACC 
GGTGCGAGCG GTTTCGCCTT CCACCTGGGT GGTGACTTCC CAGGGCTGGA TCTCCAGTTC 
TGGGCAATAA GGAGTTGA

Protein sequence

MVCRNRVVWR EGAFIKPHHF QQQQRSLEGL LDLRLQAVSG YSHGFLQLEL NSEFLGFGRI 
ALTRARGIMP DGTAFDLPGD DLEPPPLAVD EAGMANQRVY LGLPLAGDGV AEVSDEDAIR 
DDGRYRLHRR EIWDLHTSPG DVAELAVARA APRLLLEHDD RSGYACLAVA RILERRPDGS 
LVLDPDFIPT TLTTRVAPGL QRFIGEVAGL MQARARRIAQ RLAAPQQAGV ADVSDFMLLQ 
LLNRLQPRFQ HLQQHRRLHP EALYSHMLEA CSELATFTDE SRLPRRYPPY DHDAPDTAFR 
ALMQGLRQAL STVLEARAVA IPLEARRHGL MLAPLSDSTL LDEAEFVVAV RADMAVETLR 
RQFIQQTKIA GIERIRDLVS LQLPGIPLVP LPVAPRQLPY HASHIYFQLD RRSEAWGLLT 
GASGFAFHLG GDFPGLDLQF WAIRS