Gene Mext_1623 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_1623
Symbol
ID	5834894
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	1808487
End bp	1809716
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	73%
IMG OID	641367421
Product	glycosyl transferase group 1
Protein accession	YP_001639093
Protein GI	163851050
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.0129932
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGAG GCAGCCTGTC CGGCGGCCCG GTGCAGTTGT CCGAGGCTTC GCCGTTGGCG 
GGCGTCACGG TGCTGCAGAT CATCCCGGCG CTTGAGGCGG GGGGCGCCGA GCGCACCACC 
GTCGACGTCG CGGCCGCCCT CGCCGAGGCC GGCGCGCGGC CGCTGGTAGC CACGGAGGGC 
GGGCGGCTCG TTGGCGAGTT GCAGGCCAAG GGCGGGATCT GGGTGCCGTT TCCCGCCAAC 
ACCAAGAACC CGTTCGCCAT GGCGCTCAAC GTCGAGCGCC TCGCCCGGCT CTGCCGCCGC 
GAGAACGTAC AGATCCTGCA CGCCCGCTCC CGCGCTCCGG CCTGGGTCGC GCTCGGCGCC 
GCGCGCCGGC TGAAGCTGCC CTTCGTGACG ACCTATCACG GCAGCTATTC GGGCCGGACC 
AGCGTCAAGG TCCTGTACAA TTCGGTGATG GCGCGGGGCG ACGTCGTGAT CGCCAACTCG 
CACTACACCG CCGACCTGAT CCGCCGGACC CATCCCGACC AAGCCGGCGG CCGGATCAGC 
GTGATCCACC GCGGCACGGA TCTGGCGGCG TTCACGCCCT CGGCGGTCGC GGCGGCACGG 
GTCGAAAGCC TGCGCCGGGC CTGGAACGTG GCACCGCACG AGCGGGTCGT GCTGCTCGCC 
GCCCGGCTCA CCGCCTGGAA GGGCCAGCGG GTGCTGATCG AGGCCGCCGC GCGCCTGCGC 
GATCTCGGCC TCACCGACTT CGCCGTCGTG CTCGCGGGCG ATCCGCAGGG ACGCACCGCC 
TATGAGCGCG AACTCGACGC GCTGATCGAG ACACGCGGCC TGTCGGGCAT CGTGCGCCGG 
GTCGGCCATT GCACCGACAT GCCGGCGGCC TTCCGCGCGG CCTCCGTCGT CGCGGTCCCC 
TCGGTGGAGC CGGAAGCGTT CGGCCGCTCG GCGGTCGAGG CGCAGGCGCT CGGCATTCCG 
GTGGTCGTCT CCGATCTCGG TGCCGTGCCC GAGACCGTGC TGGCGCCCCC CGATGTCGAG 
CCCGGCCAGC GCACCGGCTG GCGGGTGCCG CCCGGCGATG CCGCGGCTCT GGCCGAGGCG 
TTGAAGGACG CGCTCTCCCT CGGCGCCAGC GCCCGCGACG GCCTCGCGCG CCGGGCGCAG 
GCCCATGTCG AGGCGAATTT CTCGCTCGAT CGCATGATCG AGGGCACCCT GAACGTCTAC 
GCCGACCTTC TGAACCGAGC CAAAACGTGA

Protein sequence

MSGGSLSGGP VQLSEASPLA GVTVLQIIPA LEAGGAERTT VDVAAALAEA GARPLVATEG 
GRLVGELQAK GGIWVPFPAN TKNPFAMALN VERLARLCRR ENVQILHARS RAPAWVALGA 
ARRLKLPFVT TYHGSYSGRT SVKVLYNSVM ARGDVVIANS HYTADLIRRT HPDQAGGRIS 
VIHRGTDLAA FTPSAVAAAR VESLRRAWNV APHERVVLLA ARLTAWKGQR VLIEAAARLR 
DLGLTDFAVV LAGDPQGRTA YERELDALIE TRGLSGIVRR VGHCTDMPAA FRAASVVAVP 
SVEPEAFGRS AVEAQALGIP VVVSDLGAVP ETVLAPPDVE PGQRTGWRVP PGDAAALAEA 
LKDALSLGAS ARDGLARRAQ AHVEANFSLD RMIEGTLNVY ADLLNRAKT