Gene Mlg_2788 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2788
Symbol
ID	4269722
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	3170819
End bp	3171847
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	64%
IMG OID	638127550
Product	TRAP dicarboxylate transporter- DctP subunit
Protein accession	YP_743618
Protein GI	114321935
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000133752
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTCAA AAAAAACCTA TCGCCCCCGT TGGGCATTTG CAGTTACCGT CACGATGTGT 
GCCCTGGCTG CGGCGCTCGT CTGGCCCATG AGTGCGCAAG CGCAGATGCG GCTGGACGCC 
TCCCACCAGT GGCCAGGCGG TCAGGGTGAC GTCCGTGACG AGATGGTCCA GATCATCGCG 
AACCGAGCGG AGGAGGCCGA TGTGGGCCTG CAGGTGCGCG TCTACCCCGG CGCTTCCCTG 
TACCAGCCCC GTGAGCAGTG GCCGGCACTG TCCCGTGGCC GGCTGGCCAT CACTGCGTTG 
CCGCTGGCCT ATGTCGGTGG CCGTGTGCCG GAGGTGAACC TGACCCTGAT GCCGGGCCTG 
GTCCGCAATC ACGATCACGC GCGGCGGATT AACGAGTCGC CCTTCATGGA GCGGCTGGAA 
GAGATCATGC TCGAGCACGG CGTGAAGGTG CTGGCACATA CCTGGCTGGC CGGGGGTTTT 
GGCTCCACTA AGCAGTGCAT CCTGCATCCG GACGACGTGG ACGGCATCAA CATCCGTGCC 
GCCGGCGCCG CCTTCGAGCA GATGCTGGCC GAGGCCGGGG CATCCATCGC CTCCATGCCC 
AGCTCCGATA TCTATACCGG GCTGCAGACC GGGGTGCTGG ACTCCGCCAA CACCAGCTCC 
GCAAGCTTTG TCTCCTTCCG CCTCTACGAG CAGCTGGAGT GCGTGACCCC GCCGGGTGAC 
TACGCCCTGT GGTTCATGTA CCAGCCGATT TTGGTCTCCA CCCGCATCTG GGATCGCCTC 
GACGAAGAGC AGCAGGCTGT GTTGCTGGAG GCGGGCCAGG AAGCCGAAGA GTTCGCCTAT 
CATGCCGCCA TTGAGGCCGA TAAGCGCTTC GCCGAGGTCT ACGAGGAGCA CGGCCGGCAG 
GTGGTTTACA TGACCGAGGA CGACTTCAAT GCCTGGCGTG AGATCGCCGA GCGCAGCTCT 
TACGCCAACT TCGTGCGCGA TGTGGAGGGC GGCCAGGAAC TGCTCGATAT GGCCCTGGAA 
GTAGAATAA

Protein sequence

MSSKKTYRPR WAFAVTVTMC ALAAALVWPM SAQAQMRLDA SHQWPGGQGD VRDEMVQIIA 
NRAEEADVGL QVRVYPGASL YQPREQWPAL SRGRLAITAL PLAYVGGRVP EVNLTLMPGL 
VRNHDHARRI NESPFMERLE EIMLEHGVKV LAHTWLAGGF GSTKQCILHP DDVDGINIRA 
AGAAFEQMLA EAGASIASMP SSDIYTGLQT GVLDSANTSS ASFVSFRLYE QLECVTPPGD 
YALWFMYQPI LVSTRIWDRL DEEQQAVLLE AGQEAEEFAY HAAIEADKRF AEVYEEHGRQ 
VVYMTEDDFN AWREIAERSS YANFVRDVEG GQELLDMALE VE