Gene Mext_1200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_1200
Symbol
ID	5831506
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	1323881
End bp	1325122
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	64%
IMG OID	641366993
Product	urea ABC transporter, urea binding protein
Protein accession	YP_001638673
Protein GI	163850630
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID	[TIGR03407] urea ABC transporter, urea binding protein

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.12535
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCTCGC GTGACCGAAA CGACGCCCAC TTCCATCTCC GCCGCCGACT TCTGCTCGGC 
CTTGCCGCCT CTCCGCTGCT AAGTGCCCTG CCCGGACGTG CCCTTGCGCA GACCGGCGCG 
GGCGCGCTCG CCGTCACCGA CAAGGAGGTG ACGATTGGCA TCCTGCACTC GATCAGCGGC 
ACCATGGCGA TGTCCGAGAC CGGGGCGACG CAAGGGGAAA GGCTCGCCAT CGAACAGATC 
AATGCGAGCG GCGGCATCCT CGGCCGCACG GTGAAGGTGA TCCAGGAGGA CGGCGCCTCC 
GACTGGCCGA CCTTTGCCGA GAAGGCGCGC AAGCTCGTCG TCAACGACCA TTGCGCGGCG 
GTGTTCGGCT GCGTGACCTC GGCCTCGCGC AAGGCGGTGC TGCCGGTCTT CGAGCAGTAT 
AACGGCCTCC TGTACTATCC GACCTATTAC GAGGGTCTGG AGCAGTCCAA GAACGTCATC 
TACACCGGCC AGGAGGCGAC CCAGCAGACG CTCGTCGCCC TCGACTGGGT GACGAAGGAG 
AAGGGCGCCA AGTCCTTCTT CATGGTCGGC TCGGACTATA TCTGGCCGCG CACCACCAAC 
AAGATTGCGA CCAAGCACAT CACCAACGTG ACCAAGGGCA CGATCGTCGG CGAGGAATAC 
TTCCCCCTCG GCCACACGCA GTTCAACTCG GTCATCAACA AGATCAAGCT CAAGAAGCCG 
GACGTCATCT TCGCCACCGT CGTCGGCGGC TCGAACGTCG CCTTCTACAA GCAGCTCAAG 
GCGGCCGGCA TCGACCTCAA GAAGCAGACG CTGGTGACGG TGTCCGTGAC CGAGGACGAC 
GTCGACGGCA TCGGCGGCGA GAACATCGCC GACGCCTATA GCTGCATGAA GTACTTCCAG 
TCGGTCAAGA CTCCGGCCAA CGAGGCCTTC GTCGCCGCCT TCAAGAAGCG CTGGGGCGAC 
AAGACCGTCA TCGGCGACAT CACTCAGGCC GCCTATCTCA GCCCCTTCCT GTGGAAGGCG 
GCGGTGGAGA AGGCCGGTTC CTTCGAGGTC GACAAGGTGA TCGCCGTTTC ACCGGGCCTC 
GAGATCAAGG ACGCACCGGA AGGCGCCGTG AAGATCCACG AGAACCATCA CCTCTGGGCC 
AAGACCCGCG TCGCCCGCGC CCGGCCGGAC GGGCAGTTCG ACGTGGTCTA CGAGAGCCCG 
GAGCTGATCG AGCCGAACCC GTTCCCGAAG GGGTATCAGT AG

Protein sequence

MRSRDRNDAH FHLRRRLLLG LAASPLLSAL PGRALAQTGA GALAVTDKEV TIGILHSISG 
TMAMSETGAT QGERLAIEQI NASGGILGRT VKVIQEDGAS DWPTFAEKAR KLVVNDHCAA 
VFGCVTSASR KAVLPVFEQY NGLLYYPTYY EGLEQSKNVI YTGQEATQQT LVALDWVTKE 
KGAKSFFMVG SDYIWPRTTN KIATKHITNV TKGTIVGEEY FPLGHTQFNS VINKIKLKKP 
DVIFATVVGG SNVAFYKQLK AAGIDLKKQT LVTVSVTEDD VDGIGGENIA DAYSCMKYFQ 
SVKTPANEAF VAAFKKRWGD KTVIGDITQA AYLSPFLWKA AVEKAGSFEV DKVIAVSPGL 
EIKDAPEGAV KIHENHHLWA KTRVARARPD GQFDVVYESP ELIEPNPFPK GYQ