Gene Mlg_1941 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1941
Symbol
ID	4268109
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2207137
End bp	2208204
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	63%
IMG OID	638126695
Product	TRAP dicarboxylate transporter- DctP subunit
Protein accession	YP_742773
Protein GI	114321090
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.44609
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAGAA CGTCTTGGCT GATCTCCACG GCTGCTGTGA CAGCTTTGGG TCTCTCGGCC 
TGCGGGGGGG ATGCGCCGGA TACCGAGGCG AATGGTGAGG CGGCCGCGCC CGCGCCCGAG 
ATGCAGACCT GGCGCGTCGC TCTGGAGGAG ATCGAGGGTA GTGTCCAGCA CCGCTATGCG 
GAACGCTTTG CCGAGCTGGT GGAGGAGCGC ACGGACGATG TGGAGTTCGT CATCTACAGC 
TACGGTGAGC TGAGCCCGAG CTTCGATGAG ATCTACACCC AGCTTCAGGA CGGGGCCGTG 
CAGTTCGGCT TTGGTTCCGG CTTCTTCGGC GGGGTGGTCC CGGAAAACGA CGTCTTCAGC 
CTGAGTTTCG TGCTGACCGA CGACGAGTGG ACCAACACCC AGATCCTCAA CGATGAGGCA 
TTTCTCTGGA GTGACCCGCT GCAATCGGCC TTCCGCGACC GCGATGTCCA GATCCTCTCA 
TTGGTCCCTG AGGGCTGGCA GGTCTGGGCC GGTAATGTAG AGATTCGCAG CGTGGAGGAC 
TTCGAGGGCG TGCGCATCCG CGTGATGGAT AACCGTCTGC TGCGCCAGAC CTACAGCGCT 
TACGGCGCCG ATCCGACCTC CGTCAGCTAT GCCGACATCT ACGGTGCGCT GGAGACCGGT 
TCCATTGACG CCAACATCCA GCCGGTGTTC GCCCACCAGG AGATGAGCTT CTACGAAGTC 
CAGGACTACA TGATCTTTGG CCGGCACAAG CCCTTCGTCG CCGCCTGGCT GGCCAACCGG 
GACTTCTGGG ACAACCTCTC CGAGGAGCAC AGGCAGGTCA TCCGTGAGGT CAACGAGGAG 
TTGGTGGAGT ACATCCACGA GGTCCAGGTG GAGCTCAACG ACCGCCGCAT GGACCAGATC 
CTCGAGGCGC GGCCGGATGT GGAGATTATC GATATCGACG AGGAGACCCG CGAGGCCTTC 
CGCGAGGCCA GCATGCCGGT GCGTGACACC TACGTGGAGA TGACCGGCGA GCGGGGTGGC 
CAGATCCTGG ACCTCCTGCT GGAGACGGTG GAGGCGCACC GGGACTGA

Protein sequence

MKRTSWLIST AAVTALGLSA CGGDAPDTEA NGEAAAPAPE MQTWRVALEE IEGSVQHRYA 
ERFAELVEER TDDVEFVIYS YGELSPSFDE IYTQLQDGAV QFGFGSGFFG GVVPENDVFS 
LSFVLTDDEW TNTQILNDEA FLWSDPLQSA FRDRDVQILS LVPEGWQVWA GNVEIRSVED 
FEGVRIRVMD NRLLRQTYSA YGADPTSVSY ADIYGALETG SIDANIQPVF AHQEMSFYEV 
QDYMIFGRHK PFVAAWLANR DFWDNLSEEH RQVIREVNEE LVEYIHEVQV ELNDRRMDQI 
LEARPDVEII DIDEETREAF REASMPVRDT YVEMTGERGG QILDLLLETV EAHRD