Gene Mext_0589 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_0589
Symbol
ID	5835813
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	650767
End bp	652821
Gene Length	2055 bp
Protein Length	684 aa
Translation table	11
GC content	71%
IMG OID	641366372
Product	glycosyl transferase family protein
Protein accession	YP_001638074
Protein GI	163850031
COG category	[R] General function prediction only
COG ID	[COG1216] Predicted glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.271762
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.0559054
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAAGC CTGATGCAAG GCGGGGCGAT GGATGGGACC TGTGGCGGGG ACGTGAGACG 
TCGTTCTCCC TGGTGTCTAT CGACGATCCC CTGTTCGACC GCCGCCTCCT CCTGTCGCCC 
CCCGATCGGA GACCGTGGCA GGACCGTTGG ATCGTCCTGA CCTACACGCT GGCCGTGCGA 
GCGTGGCCGC AGAGGCCGCT GCTGCGTCTG CTCCGCAGCG CCGGCCGACG CGACAGCTTC 
GTGCTGCCGG GTGTGGCCCT CGGCGCCGCG CGCTGGCTCG GCTACCTGCC CGGCGATTGC 
GAGGGCATCG AAATCGCGGC CGAGCCGGGC TTCGTGCTGG AGCGCGTTGG GCTGCGGAGC 
AGCGCGAGCG TCTTTGCGGA GGCGCTGCTG AAGCGGCCGG GACGCGCCGT AGCAGCCCTG 
CGCGCGGGTC TCGCGCGCGA CGAGCGGCGC TGGCGCGACA GCCTTCGCGG CGCCTGCGCG 
GTGTCGCCCC TTGCCCGCTA TCCGGCCTGG AAGGCGTCGC GGCTGTTTCG CGCCGCATCG 
ACCGAGCCAA GATCCGGCGC GCAGATCCGT CTGGTTCTTC CCGCTCCCTT CGCGCAGGCC 
GATGCGGTTG CGCGCAGCGT CGCGAGCCTG CGCGCCCAGA CCCATCAGGA CTGGTCTCTG 
CTCATCGCCT GGACGGACGG CGCCCCGCCG ACGAATCCGG GCATCGACCG GCGCGTGCTC 
AACATCTCAT GGAATCCGGC GGCGACGCTG CGCGAGCTTG CCGGAGGGGC CGACCTGTTC 
GGCCTGCTCC GCCCCGGCGA CGTCCTGGCG CCCGAGGCGC TGCACCTGCT TGCCAAGAGC 
CGGGAGGCCG AGGCGTCCGA GATGGTCTAT GCCGACGAGG AGACCGGCGG CCGGACGCTG 
AGGCCGCGCC TCAAGCCGGA TTGGAGCCCC GATCTGGCGC TTGCCATGGG CTATGTCGGC 
GCGCCCGCGC TGATCGCCGG GGACTTCCTC GCCAGACTGC CCGCCGAGCC GGTGGACACG 
CCCGACGCTT TGGCTGTCAC GCTCGATCTC GCGGCCAGTT CCGCGACCCG TGTCGCACAC 
ATCCCCCGCA TCCTGTGCCG TCGCGAGCCC GTCACGGCCG ATCCGGCCGC CCGCGCGCCG 
CACCTCGACC AGCACCTGCG CAGCACAGGA TCGTCGGCGC GTGCGGCGCT TCGGGACGGC 
CGCCTTGATC TTCAATGGCC GCTGCCGGAC CCGGCACCGC TCGTCAGCAT CATCATCCCC 
TCCCGCGACC GGTTCGACCT GATCGCGCGG GTCACCGAGG ATGTCCTCGA AAAGACGCCC 
TATCCCGCCC TCGAACTGGT GATCGTGGAC AATGGCTCGA AGGAGCCGGC GGTGCTGGAT 
CTGTATGAGC GGTTGCGCCT CGATCCACGG GTCCGGATCG AGCCCTATCC GCACCCCTTC 
AATTTTTCGG CACTGGTCAA TGCCGGCGCG CGGAAGGCGC GCGGCGGCGT CCTCGTCCTG 
CTCAACAACG ACGTGGCGGT ACTGCGGCCC GACTGGCTCG ACGTTCTCGT CGCTCAGGCG 
GTCCGGCCGG AGGTCGGCGC GGTCGGCGCG AAACTCCTCT ACGAGGATGG GCGCCTTCAG 
CACGCGGGTG TCGTGGTCGG ACTCGGCGGC GAGGCCGGCC ATATCCTGCG CCGCCGCCCC 
GCCGACACGC CCGGCCATCT CGATCGCCTG AGCGTGGCGC ATGAGGTCTC GGGCGTCACG 
GCGGCCTGCC TCGCCGTCAC GCGCGACAAG TACCAGGCCG TGGGCGGTTT CGACGAAGAG 
ACCTTTGCCG TCGATTTCAA CGATATCGAC TTCTGCCTGC GTCTCGGCGT GCGGGGCTGG 
AAGACGGTGT GGACACCGCA TGCGGTGCTG TCTCACCTCG AATCGGTGAG CCGCGGCCGG 
CCGGTCGGTG AGGCCCGCGC GCGCTTCGAG CGCGAGGCCG CCGCCTTCAC CGAACGCTGG 
CGCGACGTGA TCCGGCACGA TCCGTTCTAC CATCCGGCCC TCTCGCTCAC GACCTTCGGC 
GAGGAGCTGG AATGA

Protein sequence

MAKPDARRGD GWDLWRGRET SFSLVSIDDP LFDRRLLLSP PDRRPWQDRW IVLTYTLAVR 
AWPQRPLLRL LRSAGRRDSF VLPGVALGAA RWLGYLPGDC EGIEIAAEPG FVLERVGLRS 
SASVFAEALL KRPGRAVAAL RAGLARDERR WRDSLRGACA VSPLARYPAW KASRLFRAAS 
TEPRSGAQIR LVLPAPFAQA DAVARSVASL RAQTHQDWSL LIAWTDGAPP TNPGIDRRVL 
NISWNPAATL RELAGGADLF GLLRPGDVLA PEALHLLAKS REAEASEMVY ADEETGGRTL 
RPRLKPDWSP DLALAMGYVG APALIAGDFL ARLPAEPVDT PDALAVTLDL AASSATRVAH 
IPRILCRREP VTADPAARAP HLDQHLRSTG SSARAALRDG RLDLQWPLPD PAPLVSIIIP 
SRDRFDLIAR VTEDVLEKTP YPALELVIVD NGSKEPAVLD LYERLRLDPR VRIEPYPHPF 
NFSALVNAGA RKARGGVLVL LNNDVAVLRP DWLDVLVAQA VRPEVGAVGA KLLYEDGRLQ 
HAGVVVGLGG EAGHILRRRP ADTPGHLDRL SVAHEVSGVT AACLAVTRDK YQAVGGFDEE 
TFAVDFNDID FCLRLGVRGW KTVWTPHAVL SHLESVSRGR PVGEARARFE REAAAFTERW 
RDVIRHDPFY HPALSLTTFG EELE