Gene Mext_3381 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_3381
Symbol
ID	5834959
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	3746599
End bp	3747852
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	64%
IMG OID	641369180
Product	ABC transporter substrate-binding protein
Protein accession	YP_001640838
Protein GI	163852795
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID	[TIGR03407] urea ABC transporter, urea binding protein

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGACG ACAAGAAGGG CCTGGACTCG GCCCTGCGGC GCAAGCTTCT CATGGGTCTC 
GCGGGGCTTC CCGCGCTGGC GATGATGCCG CGGATGGCGT TCGCCGCCGC GCCGACCTCG 
GCCGTCAACA CGACCGGGCT CGCGGTGACC GACACGGAAG TCACGGTCGG CATCCTGCAC 
TCGGCCACCG GCACGATGGC GATCTCCGAG ACCGGCTCGA TCCAGGCCGA GAAGCTCGCG 
ATTGCCCAGA TCAACGAGAT GGGTGGCGTG CTCGGCCGCA AGATCAAGGT GATCCAGGAG 
GACGGCGCCT CCGACTGGCC GACCTTTGCC GAGAAGGCCA AGAAGCTCCT CGTCAACGAC 
CATTGCGCCG CGGTGATGGG CTGCTGGACC TCCGCCTCGC GCAAAGCCGC GCTGCCGGTC 
TTCGAGCAGT ATAACGGCCT GCTCTACTAC CCGACCTTCT ACGAGGGCCT GGAGCAGTCC 
AAGAACGTGA TCTACACCGG CCAGGAGGCG ACGCAGCAGA TCCTTGCCTC GCTCGACTGG 
GTTGCCAAGG AGAAGGGCGC CAAGTCGTTC TTCATGGTCG GCTCGGATTA CATCTGGCCG 
CGCACCTCGA ACAAGATCGC CCGCAAGCAT ATCGAGAACG TGCTCAAGGG CACGGTCGCC 
GGCGAGGAGT ACTTCCCCCT CGGCCACACG CAGTTCAACT CGGTCATCAA CAAGATCAAG 
CTCAAGAAGC CGGACGTGAT CTTCGCCGAC GTGGTCGGTG GCTCGAACGT GGCGTTCTAC 
AAGCAGCTCA AGGCGGCGGG CATCGACCTC AACAAGCAGA CCCTGCTGAC GATCTCGGTC 
ACCGAGGACG AGATCGACGG CATCGGCGGC GACAACATCG CCGGCGCCTA TTCCTGCATG 
AAGTACTTCC AGTCGCTGAA GAACCCGAAC AACGAGAAGT TCGTCGCCGC CTTCAAGAAG 
ATGTGGGGCG ACAAGACCGT CATCGGCGAC GTGACCCAGG CTGCCTATCT CGGCCCGTTC 
CTGTGGAAGA TGGCGGTGGA GAAGGCCGGC TCCTTCGATG TCGACAAGGT CGCCGCGGCG 
TCCGCCGACA TCGAGTTCAA GGAGGCGCCG GAAGGCTACG TGAAGGTTCA CCCGAACCAT 
CACCTCTGGT CGAAGACCCG CGTCGCCAAG GCCCTGCCGA GCGGCCAGTT CGAGGTGGTC 
TACGAGAGCC CCGAGCTGAT CGAGCCGAAC CCCTTCCCGA AGGGCTACCA GTAG

Protein sequence

MADDKKGLDS ALRRKLLMGL AGLPALAMMP RMAFAAAPTS AVNTTGLAVT DTEVTVGILH 
SATGTMAISE TGSIQAEKLA IAQINEMGGV LGRKIKVIQE DGASDWPTFA EKAKKLLVND 
HCAAVMGCWT SASRKAALPV FEQYNGLLYY PTFYEGLEQS KNVIYTGQEA TQQILASLDW 
VAKEKGAKSF FMVGSDYIWP RTSNKIARKH IENVLKGTVA GEEYFPLGHT QFNSVINKIK 
LKKPDVIFAD VVGGSNVAFY KQLKAAGIDL NKQTLLTISV TEDEIDGIGG DNIAGAYSCM 
KYFQSLKNPN NEKFVAAFKK MWGDKTVIGD VTQAAYLGPF LWKMAVEKAG SFDVDKVAAA 
SADIEFKEAP EGYVKVHPNH HLWSKTRVAK ALPSGQFEVV YESPELIEPN PFPKGYQ