Gene Mext_0202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_0202
Symbol
ID	5831844
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	217798
End bp	218946
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	71%
IMG OID	641365987
Product	hypothetical protein
Protein accession	YP_001637699
Protein GI	163849656
COG category	[R] General function prediction only
COG ID	[COG4671] Predicted glycosyl transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.45206
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAGC CGATTGCGTT TTTTGTCCAT CATCAGGGCC GGGGCCATGC CAACCGCACC 
ATGGCGGTGG CCGCCGAGTT CGCCCGCGAC CGTCCGGTCT CGGTGCTGAC CGCCGGCCCG 
CACCTGTTCG ACGGATTTTC CCGCGACATC GAGATCGTGA CGCTGCCGAA CATGATCGGC 
GCGGCGGTGC CGACCCCGCG CCTCTACGCG GAGCCGACGC CGCCGGTGAT GCACTGCGTG 
CCGCTGGGGC TCGCCGAAAT GCGTCGCACC ATGCGCCAGA TCCTCGACCA TCTCGACGAG 
CGCGCGGCCG GTCTGTTCGT GGTCGACGTG TCGGCGGAGA TCGCGATGCT CGCGCGCATC 
GCCAGTGTCC CCGCGGTCCA GATCCGCATG CACGGCGACC GCAACGACAT CGCCCATCTC 
GGCGCCTACG AGGCCTGCGT CGGAATGCTC GCCCCCTTCG ACGAACGGCT GGAGCAGGAC 
GACTACCCGG CGCATCTGCG CGACAAGACG TTCTATAGCG GCGGGCTCTG CACCAGCGTC 
GATCGCGTGC CGGATCGTGC CGAGGCGCGG GCCCGTCTCG GCCTCGACCC GCAGCGCGAG 
ATCGTCGTCG CGGTCACCGG CGGCGGGGGA AGCGGCACGC CCTACGCGCC GCTGACGGTC 
GCCGCCCGCG CCGCGCCCGA CGCACTCTGG CTGACTCTGG GGCCGACCCA CCGCGAAGGC 
CATGAGACCG ACTTCGCCAA CCTGCGCGAA CTCGGCTGGG TGCCGTCGGT CACCGACTAT 
CTCGCGGCGG CCGACATCGT GGTCGCCTCG GCGGGCGACA ACACGGTGCA CGAAGTCGCG 
CGCGTGGCGG GGCGCCTGAT CGTCATGCCG GAATGGCGCT ATTTCGGCGA GCAGGCCCGC 
AAGGCCGAGG CTTTGGTCCG CTTCGGCGCC GCCGTGCAGG CGCCCCATTG GCCCGGCGAC 
TTTCACGGAT GGCGCGATCT TCTCGACCGC GCCCGCAGCC TCGACGGGAC CATCCTGCGC 
AGCCTCTACG CACCGGACGC CGCCACGCGC GCGGCCGGTT GGCTCGAAGG GCTCACCGAC 
GCGCTCTGGC AGGGCGGATC GGCCGTGCAG GAGCCGGACG CCACGCCGCT GCGCGTCGTC 
GCCGGCTGA

Protein sequence

MKKPIAFFVH HQGRGHANRT MAVAAEFARD RPVSVLTAGP HLFDGFSRDI EIVTLPNMIG 
AAVPTPRLYA EPTPPVMHCV PLGLAEMRRT MRQILDHLDE RAAGLFVVDV SAEIAMLARI 
ASVPAVQIRM HGDRNDIAHL GAYEACVGML APFDERLEQD DYPAHLRDKT FYSGGLCTSV 
DRVPDRAEAR ARLGLDPQRE IVVAVTGGGG SGTPYAPLTV AARAAPDALW LTLGPTHREG 
HETDFANLRE LGWVPSVTDY LAAADIVVAS AGDNTVHEVA RVAGRLIVMP EWRYFGEQAR 
KAEALVRFGA AVQAPHWPGD FHGWRDLLDR ARSLDGTILR SLYAPDAATR AAGWLEGLTD 
ALWQGGSAVQ EPDATPLRVV AG