Gene Mlg_1943 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1943
Symbol
ID	4268111
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	2209349
End bp	2210632
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	64%
IMG OID	638126697
Product	TRAP dicarboxylate transporter, DctM subunit
Protein accession	YP_742775
Protein GI	114321092
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1593] TRAP-type C4-dicarboxylate transport system, large permease component
TIGRFAM ID	[TIGR00786] TRAP transporter, DctM subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.0780102
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCTGGA TCATGGTCGG CATCATGGTG GGGCTGCTGC TCCTGGGCTT CCCGCTGATG 
GTGCCGCTGC TCTCCGCAGC CCTCTACGTC ATGCTGTTCG AGCTGGATTT CATCAGCACG 
AACCGCATTG TCGCGCAAAT GGTCTCCGGC ATCTCCTCGC CGGTGCTGGC GGCGGTGCCG 
TTGTTCATCC TCGCCGCCGA CATCATGACC AAGGGCCGCA CCGCCAACCG TCTGTTGGAT 
CTGGTCATGA GCTTCTTCGG CCACCTGCGC GGGGGGCTGC CGGTCACCGC GGCCATCAGC 
TGCACCCTTT TCGGTGCGGT CTCCGGCTCC ACCCAGGCGA CGGTGGTGGC CATCGGCGGG 
CCGCTGCGCC CAAAGCTGAT CAAGGCCGGC TATAAGGACA GCTTCACCAC CGCACTGATC 
ATCAACGCCA GTGACATCGC CCTGCTCATC CCGCCGAGCA TCGGCATGAT CGTCTACGGC 
GTGGTCTCCC GCACCTCGGT GCGCGAACTG TTCATCGCCG GCATCCTGCC CGGGCTGCTG 
ATCCTGCTCT TCTTCTGTGT CTACACCTAT ATCTACTCCC GGCTAAAGCA GATCCCGGTG 
CAGGACAGGT CAACCTGGTC GATTCGGCTG CAGGCCCTGC GCGGGGCCTT GCTACCCATG 
GGCTTCCCGA TCATTGTCGT GGGTGGCATC TACGCCGGCT TCTTCTCCCC CACCGAGGCA 
GCGGCCGTCT CCGTGGCCTA CGCCTTCCTG CTGGAGGTGG TGATCTTCCG GTCGCTGCAC 
ATCAAGGAGA TCTGGCCCAT CGCCCTGTCC ACCGGGTTGA TCACCGCGGT GGTCTTCGTG 
CTGGTGGCCT CCGGCCAGGT CTTCTCGTAC GTGGTCTCGG CAGCGCGGAT CCCCCGGGAG 
TTGATCGGGC CGCTGATCGA GACCCTGGCG GGCAACCCCG AGATGGCGTT AATCGTCATC 
GCCCTCGCCT ACTTCATCGG CTGTATGTTC GTGGACCCCA TCGTGGTCAT CCTGGTGCTG 
ACACCGATCT TCACCCCGCT GGTGGACGCC ACCGGGCTCG ACCCGGTGCA CGTGGGCGTC 
ATCGTCACCC TGCAGGCGGC CATCGGTTCG GCCACGCCAC CCTTTGGCTG CGACATCTTC 
ACCGCCATCG CGATCTTCAG GCGACCTTAC TGGGACACCA TCAAGGGCAC GCCGCCGTTC 
ATCTTTATCC TGTTGCTGTC CACGGCGGTG CTCATCGCCT TCCCGCAGAT CTCGCTGTTC 
CTGCCGCAAC TGGCCTTCGG CTAG

Protein sequence

MIWIMVGIMV GLLLLGFPLM VPLLSAALYV MLFELDFIST NRIVAQMVSG ISSPVLAAVP 
LFILAADIMT KGRTANRLLD LVMSFFGHLR GGLPVTAAIS CTLFGAVSGS TQATVVAIGG 
PLRPKLIKAG YKDSFTTALI INASDIALLI PPSIGMIVYG VVSRTSVREL FIAGILPGLL 
ILLFFCVYTY IYSRLKQIPV QDRSTWSIRL QALRGALLPM GFPIIVVGGI YAGFFSPTEA 
AAVSVAYAFL LEVVIFRSLH IKEIWPIALS TGLITAVVFV LVASGQVFSY VVSAARIPRE 
LIGPLIETLA GNPEMALIVI ALAYFIGCMF VDPIVVILVL TPIFTPLVDA TGLDPVHVGV 
IVTLQAAIGS ATPPFGCDIF TAIAIFRRPY WDTIKGTPPF IFILLLSTAV LIAFPQISLF 
LPQLAFG