Gene Mlg_0188 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0188
Symbol
ID	4268630
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	217984
End bp	219318
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	67%
IMG OID	638124912
Product	branched-chain amino acid ABC transporter, periplasmic amino acid-binding protein, putative
Protein accession	YP_741033
Protein GI	114319350
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID	[TIGR03407] urea ABC transporter, urea binding protein

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAAA CGCAAACGCG TACCAACCCC GTCGCCGGCC TGCGCCGCAC CGCCATCGCG 
GCGGGCGTCA TGGCTGCCGT CGGTCTGGGG GGGCCGGCGG TGGCCGACGA GGGGCCGATC 
AAAGTGGGCA TCCTCCACTC CCTGTCCGGC ACCATGGCCA TCAGCGAGAC CTCGCTGCGG 
GACGTGGCGT TGATGACCAT CCAGCAGATC AACGAGCAGG GCGGCCTGCT GGGCCGGGAG 
CTGGAGCCGG TGGTCATGGA CCCCGCCTCC GACTGGCCCC GCTACGCCGA GCAGGGCCGC 
GAGCTGCTGG AGCGCCACGA GGTGGACGTC ATCTTCGGCT CCTGGACCTC CGTCTCCCGC 
GAGGCGGTGC TGCCGGTGCT GGAAGAGCTG AACGGCCTGA TGTTCTATCC GGTGCAGTAC 
GAGGGCGAGG AGTCCTCCCG CAACATCTTC TACACCGGCG CGGCCCCGAA CCAGCAGACC 
ATCCCCGCCG TGGAATACCT GATGAGCCCA GAGGGCGGCG GCGCCGAGCG CTTCTACCTG 
GTGGGCACCG ACTACGTCTT CCCGCGCACC ACCAACCGCA TCGTGCGCGC CTTCCTCAAT 
CACCACGGGG TCAGCGACGA CGATATCGAA GAGGTTTACT TCCCCTTCGA GCACAGCGAC 
TTCCAGTCCC TGGTCGGTGA TATCCGTAGC TTCGCCGACG GCGGCCCCAC CGCGGTGATC 
AACACCGTCA ACGGCGACTC CAACGTGGCC TTCTACCAGG AGCTGGCCAA CCAGGGCATC 
GACGCCATCG ACATCCCGGT GATGGCCACC TCCGTCGGCG AGGAAGAACT GCGCGGCATG 
GACACCGGCC CTCTGGTGGG CCACCTGGCC GCCTGGAACT ACTTCATGTC CATCGATACC 
CCGGAGAACG AGACGTTCGT TTCCACCTGG ATGGACTACG TGGAGGCCGA GGGCCTGAGC 
GGTGGCAGTG ACCGGGTCAC CAACGACCCC ATGGAGGCCA CCCACATCGG CATCCGCATG 
TGGGCCCAGG CGGTGCTGCA GGCCGGTACC ACCGACGTGG ACGCGGTGCG CCAGGCGGTC 
TACGGCCAGT GCGTGGACGC CCCCTCCGGT TTCGAGATCT GCATGGACGA GGAGAACCAC 
CACCTGCACA AGCCGGTGAT CATCGGCGAG ATCCAGCCCG ACGGCCAGTT CGCCCCGGTC 
TGGGAGACCG ACGGTCCGGT GCGCGCGGAG CCCTGGAGCG AGTACCTGGA GGACAGCCGG 
GACAAGGTCG CCAACTGGCG TTATCCCTGG GTCTGCGGTG ACTGCACCGA GCCCACCTAC 
GAGCTGGACT TCTGA

Protein sequence

MSKTQTRTNP VAGLRRTAIA AGVMAAVGLG GPAVADEGPI KVGILHSLSG TMAISETSLR 
DVALMTIQQI NEQGGLLGRE LEPVVMDPAS DWPRYAEQGR ELLERHEVDV IFGSWTSVSR 
EAVLPVLEEL NGLMFYPVQY EGEESSRNIF YTGAAPNQQT IPAVEYLMSP EGGGAERFYL 
VGTDYVFPRT TNRIVRAFLN HHGVSDDDIE EVYFPFEHSD FQSLVGDIRS FADGGPTAVI 
NTVNGDSNVA FYQELANQGI DAIDIPVMAT SVGEEELRGM DTGPLVGHLA AWNYFMSIDT 
PENETFVSTW MDYVEAEGLS GGSDRVTNDP MEATHIGIRM WAQAVLQAGT TDVDAVRQAV 
YGQCVDAPSG FEICMDEENH HLHKPVIIGE IQPDGQFAPV WETDGPVRAE PWSEYLEDSR 
DKVANWRYPW VCGDCTEPTY ELDF