Gene Mlg_1667 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1667
Symbol
ID	4268899
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	1907333
End bp	1908604
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	63%
IMG OID	638126425
Product	protein of unknown function DUF395, YeeE/YedE
Protein accession	YP_742503
Protein GI	114320820
COG category	[R] General function prediction only
COG ID	[COG2391] Predicted transporter component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.432658
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCTTCG AAAGCTTCAA CACGGCGTTG ACGGCCTATT TCGCCGCCGT GTTCGTCCTT 
GCAGTGATAC TCGGTGCGGT GGTTAATAAG ACCAACTTCT GCACCATGGG GGCGGTCTCC 
GACGTGGTCA ACATGCAGGA CTGGGGCCGG ATGCGGGCCT GGTTCCTGGC CATCCTGGTG 
GCCATGTTGG GGGTCATTCT CTTCGAGGCC GCCGGCCTGA TCGACCTGAG CAGCACCCAA 
CCCCCCTACC GCCGGGCGCA GTTTCCCGTG GTGGAGTACA TCCTCGGGGG GCTGATCTTC 
GGTATCGGCA TGACCCTGGC CAGCGGCTGT GGCAACAAGA CGCTCATCCG CGTTGGTGGC 
GGCAACATCA AATCCATTCT GGTCATGGTG GTGCTGGGGA TCGTCGCCTA CTACACCATC 
AACCCCATCC CCGGCACCGA GCACAACCTG CGCGGCCTGC TGGTCTGGTG GTGGAGCTCG 
CCGTTGGCGA TCGAGTTTTC CGTAGCCCAG GACGTTGGGC ACGTGCTCGC CGGGCCGGAC 
AACGCCACCG GCGTCCGGTT GATGATCGGC CTCGCCCTGG TGGCCGGCGT CGGCTGGTGG 
ATATTCCGCT CCGCGGAGTT CCGAAGCAAC CGCGACAACA TCGTGGCCGG CGTCGTGATC 
GGCCTTTGCA TTGCCCTGGC CTGGCTGGTT ACCGACAACA TTCGACTGCA GGATAGCTGG 
GGCGACGAGC ATTCGCTGCC CGGCTACGTC CAGGAGTGGG ATTTCGTCAC CGACGGGGAG 
GAGGCCTTCC GCCCTGCCAG CGCCGGCGGG GTGAACACCC AGTCCTTCAC CTTCATTGGC 
CCCATCGCGC AGACGATCAA TTATTTGGCC CGTGGCGCCG ACAATGCCTA TCTGACCTTC 
GGCGTGGTCT CCGTCAGCGG GGTGATACTC GGCTCCCTGC TCTGGGCGCT GCTCAGCCGG 
AGCTTCCGGG TCGAGTGGTT CGTCAATGGC CGCGACGTGC TCAACCATTT GGTCGGCGCG 
GCCTTGATGG GTTTCGGCGG CGTGATGGCC ATGGGCTGCA CCATCGGCCA GGGTGTCACC 
GGGCTGTCGA CCCTCGCCCT CAGTGGCTTC TTTACCCTGG GCTCGATCAT ACTGGGCAGT 
GCACTGACCA TGAAAATCCA GTACTACAAG ATGCTATACG ATGAGGAGGC GACCTTTGCC 
AAGGCGCTGA TCACCGGCCT GGTGGACATG AAGCTGTTGC CCGGCTCCCT GCGCAAGCTC 
GAAGCGCTCT GA

Protein sequence

MIFESFNTAL TAYFAAVFVL AVILGAVVNK TNFCTMGAVS DVVNMQDWGR MRAWFLAILV 
AMLGVILFEA AGLIDLSSTQ PPYRRAQFPV VEYILGGLIF GIGMTLASGC GNKTLIRVGG 
GNIKSILVMV VLGIVAYYTI NPIPGTEHNL RGLLVWWWSS PLAIEFSVAQ DVGHVLAGPD 
NATGVRLMIG LALVAGVGWW IFRSAEFRSN RDNIVAGVVI GLCIALAWLV TDNIRLQDSW 
GDEHSLPGYV QEWDFVTDGE EAFRPASAGG VNTQSFTFIG PIAQTINYLA RGADNAYLTF 
GVVSVSGVIL GSLLWALLSR SFRVEWFVNG RDVLNHLVGA ALMGFGGVMA MGCTIGQGVT 
GLSTLALSGF FTLGSIILGS ALTMKIQYYK MLYDEEATFA KALITGLVDM KLLPGSLRKL 
EAL