Gene Mext_3956 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_3956
Symbol
ID	5835641
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	4393838
End bp	4395154
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	68%
IMG OID	641369747
Product	C4-dicarboxylate transporter DctA
Protein accession	YP_001641398
Protein GI	163853355
COG category	[C] Energy production and conversion
COG ID	[COG1301] Na+/H+-dicarboxylate symporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.205542
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCATG CCGCCACCCT GTCGACCGAG CGGGCGCCGC TCCACAAGTC CCTGTTCGTG 
CAGGTGATCG CCGGGCTTCT GGCCGGCATC CTCGTCGGCG CTCTGGCGCC CGGCTTCGCC 
GCAGAGCTGA AGATCCTGAG CGACGCCTTC CTCCGGCTGA TCGCGATGAT CGTGGCGCCG 
ATCGTGTTCT GCGTCGTCGT GCACGGCATT GCCGGGGCGG GCGACCTCGG GAAGGTCGGG 
CGGGTCGGCG TGAAGGCGCT GATCTATTTC GAGGTGATGA CGAGCCTGGC CCTCCTGCTC 
GGGCTTGGGC TCGCCTACCT CGTCGGGCCG GGCCACGGCA TGAACATCGA TGTCGCAAGC 
CTCGATGCCG GCGCCCTCGG CGGCTACGCC GATTCCGCGC AGAAGCTGCA GGGCGGCGGC 
ATCGCGCATT TCCTCCTCGC CATCATCCCT AAGACCGCCT TCGACGCGTT CGCCCGCAAC 
GACGTGCTGC AGGTCCTGTT CTTCGCCGTT CTGTTCGGGG TGAGCCTCGC CCTGGTCGGC 
GGCGAGAAGG CCAGGGCGGT CTCGGGCCTG ATCGACGCTC TCTCCACGGT GCTGTTCAAG 
GCCATGGGGC TGATCGTGCG GGTGGCCCCG CTCGGGGTGT TCGGCGCCGT CGCCTACACG 
GTCGGACGCT ACGGCATCGG CTCGCTGGCG CAGCTCCTCT CGCTCGTGGC CCTGTTCTAC 
CTCGCGGTGG CTTTGTTCGT GTTCGTGATC CTCGGCGCGG TGATGCGGCT CGCGGGCCTC 
AGCCTCGTAA AGCTCCTGAT CTATCTGCGC GAGGAGCTGA CCATCGTGCT CGGCACCTCC 
TCCTCCGACG CGGTGCTGCC GCAGATCATG CGCAAGCTCG TGCATCTCGG GGTGAAGGAT 
TCCACCGTCG GCCTCGTGGT GCCCACGGGC TATTCCTTCA ACCTCGATGC CTTCTCGATC 
TATCTGACGC TTGCCGTCGT CTTCATCGCG CAGGCGACCA ACACGCCGCT CTCCTTCAGC 
GACCTGATGC TGGTGCTCGG CGTCTCGCTG GTCACCTCGA AGGGCGCCCA CGGCGTGCCC 
GGCTCGGCCA TCGTGATCCT GGCCGCGACC CTGAACGCCG TCCCCTCGAT TCCCGCGATC 
GGCCTCGTGC TGGTGCTCTC GGTCGATTGG TTCGTCGGCA TCGCCCGGTC GCTGGGCAAC 
CTGATCGGCA ATTGCGTCGC CACCGTTGTC GTCGCCGCCT GGGAGGGCGA CCTCGACCGG 
GAGCGTGCCG TGCGGGTGCT CGACGGCCGG GAGAGCCTGG AGCCCACCGC CGGTTAG

Protein sequence

MSHAATLSTE RAPLHKSLFV QVIAGLLAGI LVGALAPGFA AELKILSDAF LRLIAMIVAP 
IVFCVVVHGI AGAGDLGKVG RVGVKALIYF EVMTSLALLL GLGLAYLVGP GHGMNIDVAS 
LDAGALGGYA DSAQKLQGGG IAHFLLAIIP KTAFDAFARN DVLQVLFFAV LFGVSLALVG 
GEKARAVSGL IDALSTVLFK AMGLIVRVAP LGVFGAVAYT VGRYGIGSLA QLLSLVALFY 
LAVALFVFVI LGAVMRLAGL SLVKLLIYLR EELTIVLGTS SSDAVLPQIM RKLVHLGVKD 
STVGLVVPTG YSFNLDAFSI YLTLAVVFIA QATNTPLSFS DLMLVLGVSL VTSKGAHGVP 
GSAIVILAAT LNAVPSIPAI GLVLVLSVDW FVGIARSLGN LIGNCVATVV VAAWEGDLDR 
ERAVRVLDGR ESLEPTAG