Gene Mext_3020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_3020
Symbol
ID	5835424
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	3367542
End bp	3368558
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	74%
IMG OID	641368820
Product	urease accessory protein UreD
Protein accession	YP_001640480
Protein GI	163852437
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0829] Urease accessory protein UreH
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.187317
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCACCT CACGGTCAAG AACGGCCGTC GCTGCCCGCA TCCTGTGCCA TCGCTGCCGA 
AGATCGGTGC GGGATGGCAC CCGACCGGTG GGGCCCGCCA CCTTGCGGAC CGGGGCTTCG 
GTGGCCGATG AAGCCGGCAC CCGCTCCGCC GGAGGCCGTC CGATCCCTGC CGCCGAACCG 
CTCCGCCCCG CCTTGTCCCG CCAGCGCTCG CAGGGCGCGG TGCATCTGCG CGTCGCCCCG 
GCCGGAACGG CCGCGGACGC GCCGACGCGG ATCGTCGATC TCGCCGAGAG TGGCCCCTTG 
CGCCTGCGCT GTCCCCGCCA GGGGGCCGAG CGGATGCTGG AGGGCGTGCT GGTCAATACC 
GGCGGCGGCA TCGCCTGCGG CGATGTGTTC ACGGTGTCGG TGACGGTCGA GCCGGGTGGG 
GCCTGCGTGC TGACCACCAC CGCGGCGGAG AAGATCTACC GCTCGGACGG ACCCTGCGCG 
GAGATCGTCA ACCGGGCGAG CGTCGGCGCG GGCGGGCGGC TCGATTGGCT GCCGCAGGAG 
ACGATCCTGT TCGACCGCGC CCGGCTGGTG CGCCGCTTCG AAGCGGATCT TGCCCCCGAC 
GCGTCGCTGC TCGTGGCCGA GATCGCGGTG CTCGGCCGTG CCGCTCGCGG CGAAAGCCTG 
GAGCAGGCCC TGTTCGAGGA TCGCTGGCGC ATCCGCCGCG ACGGCCGCCT TGTCTACGCC 
GACAGCCTGC GCCTCGACGG CGCGGTCACG GCCCTCATGA ACCGCCGGGC GATCGGCGGC 
GGGGCCCGCG CATTGGCGAC GATCCTCGAC CTTTCGCTGC GTGCGGAAGG CCGGCTCGAC 
GAGGCCCGTG CCCTTCTCGA CGCCCTGCCG GCGCAGGTCG AGGCCGGGGC GAGCGCCTGG 
AACGGTCACC TCGCCGTGCG GATGCTGGCC CCCACCGTCG CTCCCCTGCG CGACGCCGCC 
GCCCGCTTCC TTGCTGCATG GCGCGGGCAG CCGATGCCGC GCGTGTGGCA GACCTGA

Protein sequence

MTTSRSRTAV AARILCHRCR RSVRDGTRPV GPATLRTGAS VADEAGTRSA GGRPIPAAEP 
LRPALSRQRS QGAVHLRVAP AGTAADAPTR IVDLAESGPL RLRCPRQGAE RMLEGVLVNT 
GGGIACGDVF TVSVTVEPGG ACVLTTTAAE KIYRSDGPCA EIVNRASVGA GGRLDWLPQE 
TILFDRARLV RRFEADLAPD ASLLVAEIAV LGRAARGESL EQALFEDRWR IRRDGRLVYA 
DSLRLDGAVT ALMNRRAIGG GARALATILD LSLRAEGRLD EARALLDALP AQVEAGASAW 
NGHLAVRMLA PTVAPLRDAA ARFLAAWRGQ PMPRVWQT