Gene Mlg_2072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2072
Symbol
ID	4270458
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	2349159
End bp	2350112
Gene Length	954 bp
Protein Length	317 aa
Translation table	11
GC content	68%
IMG OID	638126828
Product	TRAP transporter solute receptor TAXI family protein
Protein accession	YP_742904
Protein GI	114321221
COG category	[R] General function prediction only
COG ID	[COG2358] TRAP-type uncharacterized transport system, periplasmic component
TIGRFAM ID	[TIGR02122] TRAP transporter solute receptor, TAXI family

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.169091
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTCGAT CCAGCCTGCT TGCCCTGCTC GCGCTGCTGG CCGCCGGCCT GACCGCGCTG 
CCCGCCCACG CCCGCGACCT GACCTTCGGC GGTGCCTCCA TCACCGGCGT CTACTATCAG 
GTGGCCCAGC ACGGCTGCCG CCTGCTGGAG CAACACAAAC CGGAGTACAA CTGCGTGGGC 
CGCCCCACCC AAGGCTCGGT GTTCAATATC AACGCCCTCT CTCAAGGCTC CATCGACTTT 
GGCGTCGCCC AGTCCGACCG CGCCTGGCAG GCCATCAACG GCCAGGCCGA GTGGGAGCGC 
CGGGGCGCCT TCGAAGGTCT GCGCAGCCTG TTCGCCATGC ACCCGGAGAC GGTCATGCTG 
GTGGTACGGG CCGACAGCGA TATCCACGCC GTAGAGGACA TCACAGGCCA CACCATCAAC 
GTCGGCAACC CCGGCTCCGG CCAGCGCCGT AACGCCATGG ACGTCCTGGA GATCTACGGC 
ATCGACCCGC GCAGCGACAT CCGCGCCCGC AACCTGCAAC AGCACGAGGC CTCCCGCGCC 
CTGGTCGATG GCCAGGTGGA CGGTTTCTTC TACACCGTGG GCAACCCCAG CGCCGCCATT 
GAGGAGCCGG CCAACACGGT AGACATCCGC ATGATCCCGC TCGACTCAGA CGCCATCCGC 
GCGTTCGTGG ACGAACGGCC CTACTACGTG ATGACCCGGA TACCCGCCGG CACCTACCCC 
GGGGTGGACG AGGACATCGG GACTTATGCG GTCACCGCCA CCGTGGTCAC CCACGCCGAC 
ATGGACGAGG CCGTGGCCTA CGACCTGACC GCCGCTGTCT TTGAACAGAT GGACGACCTG 
CGCAACGCCC ACGCCGCCTT CCGCCATCTG GAGCCCGAGG CCATGATGGA GGGCGTCTCG 
GTGGACCTCC ACCCCGGCGC CCTGCGCTAC TACGAAGAGC AGGGCTGGCG CTGA

Protein sequence

MRRSSLLALL ALLAAGLTAL PAHARDLTFG GASITGVYYQ VAQHGCRLLE QHKPEYNCVG 
RPTQGSVFNI NALSQGSIDF GVAQSDRAWQ AINGQAEWER RGAFEGLRSL FAMHPETVML 
VVRADSDIHA VEDITGHTIN VGNPGSGQRR NAMDVLEIYG IDPRSDIRAR NLQQHEASRA 
LVDGQVDGFF YTVGNPSAAI EEPANTVDIR MIPLDSDAIR AFVDERPYYV MTRIPAGTYP 
GVDEDIGTYA VTATVVTHAD MDEAVAYDLT AAVFEQMDDL RNAHAAFRHL EPEAMMEGVS 
VDLHPGALRY YEEQGWR