Gene Mext_3731 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_3731
Symbol
ID	5832632
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	4132360
End bp	4133688
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	68%
IMG OID	641369521
Product	glycine betaine/L-proline ABC transporter, ATPase subunit
Protein accession	YP_001641176
Protein GI	163853133
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4175] ABC-type proline/glycine betaine transport system, ATPase component
TIGRFAM ID	[TIGR01186] glycine betaine/L-proline transport ATP binding subunit

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.131666
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCCGGA TCAATCTTGA AGGTATCAGC AAGATATTCG GCTCGAACCC CTCCAAGGCG 
CTCGATCTGA TCGGCCAGGG GAAGCGCAAG GGCGACATCG CCGCTGCCTG CGGTGCGGTC 
GTCGGATTGC GCGACATCTC GTTCGACATC GAAGAGGGCG AGATCCTCGT CCTGATGGGC 
CTGTCCGGCT CCGGGAAGTC GACGCTCCTG CGCTGCATGA ACCGTCTGGT CGAGCCGTCC 
TGCGGCCGGA TCGTCGTGGA CGGAGTGGAC GTGACCCGGC TCGGCCGCAA GGATCTGCTC 
GCCTTCCGCC AGAAGACCTT CGGCATGGTC TTCCAGCACT TCGCGCTGCT GCCCAACCGG 
ACCATCCTCG GGAATGTCGG GTTCGGCCTC GAGATCAAGC AGGTCCCGGC CAAGGAGCGG 
ATCGAGCGGT CGATGCAGGC CATCGAACTC GTCGGCCTGA AGGGCTGGGA GACGAAGTAT 
CCCAATGAAT TGTCGGGCGG CATGCAGCAG CGGGCGGGCC TCGCGCGGGC GCTCGCCGCC 
GATGCCGACA TCCTGCTCAT GGACGAGGCC TTCAGCGCCC TCGACCCCCT GATCCGCCGC 
GACATGCAGG CGGAGTTGCG CGACCTCCAG CGCAAGCTCA AGAAGACCAT CGTCTTCGTC 
TCGCACGATC TCGACGAGGC CATCGCGCTC GGCGGCCGCA TCGTCCTGAT GAAGGACGGC 
GAGGTGGTGC AGATCGGGCA GCCCGAGGAC ATCGTGGCTC GCCCCGCGAC CGACTATGTC 
GAGCGCTTCG TCGAGCATAT CGATCTCGCC GCCGTGCTGC GGGCGGAGCA GGTCGCGGAT 
CGCTCCGCCC CCGTGCTCGC CCCCACGCAG ACAGTGGCCG AGGCGCGGAC CGCACTCGGC 
GGGGCAGGTG GCCGCACGAG CGGCCGGGCT TGGCTCGTCG CCGACGGGGA CGGACGGCTG 
GTCGGCCGCA TCTTCGCCGA GAGGCTCGCC TCCGCCCGGC CGGCCGAGAC CCTCTCCAGC 
CTGCTCGACC TCGGACAATC CGTCGTCGAG GCGGACAGCC GGCTGGACAC CATCCTCGCG 
ACGGTCGCCG CCGAGGAATC CGTCGCGGTC GTGGGCCGGA ACGGACGCCT GATCGGCTCC 
ATCACCAGCC GCGACGTCGT TCAGGCGCTC GCCGCGCGGC CCGGCACGCA CGCGCAGCCG 
CATGCCGGTG CCCCGATCCT CTCAAAGCCG TCAGGAGCCC CGACATGGAG TGGAACGTCC 
CCAAATTCCC CCTCGACACG CTCAGTGACA ACGGCCTCGA CTGGCTCACC GAGCATGGCA 
GTTGGCTGA

Protein sequence

MGRINLEGIS KIFGSNPSKA LDLIGQGKRK GDIAAACGAV VGLRDISFDI EEGEILVLMG 
LSGSGKSTLL RCMNRLVEPS CGRIVVDGVD VTRLGRKDLL AFRQKTFGMV FQHFALLPNR 
TILGNVGFGL EIKQVPAKER IERSMQAIEL VGLKGWETKY PNELSGGMQQ RAGLARALAA 
DADILLMDEA FSALDPLIRR DMQAELRDLQ RKLKKTIVFV SHDLDEAIAL GGRIVLMKDG 
EVVQIGQPED IVARPATDYV ERFVEHIDLA AVLRAEQVAD RSAPVLAPTQ TVAEARTALG 
GAGGRTSGRA WLVADGDGRL VGRIFAERLA SARPAETLSS LLDLGQSVVE ADSRLDTILA 
TVAAEESVAV VGRNGRLIGS ITSRDVVQAL AARPGTHAQP HAGAPILSKP SGAPTWSGTS 
PNSPSTRSVT TASTGSPSMA VG