Gene Mlg_0874 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0874
Symbol
ID	4269695
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	990946
End bp	991932
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	66%
IMG OID	638125626
Product	TRAP transporter solute receptor TAXI family protein
Protein accession	YP_741718
Protein GI	114320035
COG category	[R] General function prediction only
COG ID	[COG2358] TRAP-type uncharacterized transport system, periplasmic component
TIGRFAM ID	[TIGR02122] TRAP transporter solute receptor, TAXI family

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTAACA GCACCCGCAA TGTATTCGTA AGCCTGTGCG CCGGCGCGGC GCTGGCCGCC 
GGTGGCGCTG CCATCGCCGA CGACCGCGGC GACTGGCCGC GCAGCATCAC CGTGGGCACC 
GCCAGCCAGG GCGGCACCTA CTTCATTTAC GGTTCCGGCT GGGCCAACAT GGTGGGCGAA 
GCGCTGGACA TCAACGCCGG CGCCGAGGTC ACCGGCGGCC CGGTCCAGAA CGCCACCCTG 
GTGCAGACCG GCGATCACCA ATTCGGCATG GTCACCATGG GCCCCGCGCT GGCGGCCTGG 
GAGGGCGAAA GCGAACTGGC ACCGGGCCTG GAGCACAAGG ACATCCGCGC AGTGTTCCCC 
ATGTACCAGA CGGCCTTCCA GGTCATCGCC CTGTCCGGGT CCGGCATTGA GAGTGTCGCG 
GATCTCGACG GCAAAACCGT GGGCATCGGC CCGGCCGGCG GCACCGCTGA CATGTACTGG 
CCCCAGTTCT TCGAGCAGCT CGGTCTGGAT GTGCGCACCC GTAACGGCGG CGCCTCCGAC 
CAGGTGGGCC AGCTCCAGGA CGGCCTGATC GATGCCTTCG CCTTCGCCGC CGGCATCCCG 
ATCTCCGCCT TCAGCCAGGC CGAGGCCCAG GCCGACGTCA ACATCTTCTC CATCGCTGAA 
GCCGATCAGG AGGCCATTCT GGAGGCCTTC CCCGAGCTGG TCGGCTCCAG CGTCCCGGGC 
GACGCCTACC AATCCCTGGA CGCCGATATC CCGGCCATCT CCATCTGGAA CTTTGCCATC 
ACTCACAAGG ACATGCCGGA GAGTCTGGTC TATGGTGTGA CCAAGACGGT GATGGAAAAC 
AACGATGAGA TGGTGCAGAT CCACGGCGCT TCCAAGGAAA CGCTGCCGGA GAACTGGGAG 
GTCAACGACT GGCTTCCGTT CCACCCGGGC GCGGTGCGCT GGTTCGAAGA GAACGGATTC 
GACATCCCGG ATGACCTGCG CGGCTAA

Protein sequence

MLNSTRNVFV SLCAGAALAA GGAAIADDRG DWPRSITVGT ASQGGTYFIY GSGWANMVGE 
ALDINAGAEV TGGPVQNATL VQTGDHQFGM VTMGPALAAW EGESELAPGL EHKDIRAVFP 
MYQTAFQVIA LSGSGIESVA DLDGKTVGIG PAGGTADMYW PQFFEQLGLD VRTRNGGASD 
QVGQLQDGLI DAFAFAAGIP ISAFSQAEAQ ADVNIFSIAE ADQEAILEAF PELVGSSVPG 
DAYQSLDADI PAISIWNFAI THKDMPESLV YGVTKTVMEN NDEMVQIHGA SKETLPENWE 
VNDWLPFHPG AVRWFEENGF DIPDDLRG