Gene MCA2126 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA2126
Symbol
ID	3103459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	+
Start bp	2287047
End bp	2288147
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	69%
IMG OID	637171276
Product	glycosyl transferase, group 1 family protein
Protein accession	YP_114552
Protein GI	53803802
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGTGC TGCACGTCGA AGGCGGCAGA AACCTCTACG GCGGCGCCCG CCAGGTGCTG 
TACCTGCTGG AAGGGCTCGA GCAGCGCGGG ATCGACAACG TACTGGTCTG CCCGGCCGGC 
AGCGAACTCG CCCGGGAGGC CGCCGCCCAT GCCGAGGTGC ATGCCATTCC GATGTCCGGC 
GACCTCGATT TCCGCCTCAT CGGCCGGCTT TACCGGATCA TCGGGCGGGT CCGGCCGGAC 
CTCGCGCACC TGCACAGCCG GATCGGGGCG GACGTCATGG GCGGCATCGC CGCGCGTCTG 
GCCGGCGTGC CGGTGGTTCA TTCCAGGCGT CAGGACAACC CCGAGATGCG CTGGGCCGTC 
GCCGTGAAAT ACCGTCTGCA TGACCGGGTG GTCGCGATTT CCGAAGGCAT CGCGCGGGTA 
CTCGCCTCGG AAGGTCTGCC GGCGGCGAAA TTGCGCGTCG TGCGCAGCGC CATCGATCCG 
GCCCCTTTCC TCCAGCCCGG CGACCGCCCC GGGTTCCGCA CCGAATTTGG CCTGCCCGAG 
GACTGCACGG TGATCGGCGT GATCGCCCAG CTCATCGAAC GCAAGGGCCA TCGCTTTCTG 
CTCGAAGCCC TGCCCGAACT GACCGGGCGC TATCCGGGCC TGCACGTCCT CCTGTTCGGC 
AAGGGCCCGC TGGAATCTTC CCTGATCGAA ACCGTACGCC ACCTCGGCTT GGCGGACCGC 
GTCCATTTCG CCGGCTTCCG GGACGATCTG CCGCGCATCC TGCCCTGCCT GGACCTGGTG 
GTACATCCGG CCCTGCGCGA AGGCCTGGGC ATCTCACTGC TGCAGGCCGC CGCGGCCGGC 
GTCCCCATCG TGGCCTCGCG CGCCGGTGGG ATTCCCGAAG CCGTGCGCGA CGGCGACAAT 
GGACTGCTCG TCCCACCGGG CGATGCCGCG GCCCTGGCGG CCGCCATCCG CCGCCTGCTC 
GACGATCGGG ACCTGGCGCG GGACATGGGC CAGCGCGGCC GGGCGCTGAT CGGCCGTGAG 
TTCTCGGTCG AGGGCATGGT CGAAGGAAAC CTGGCAGTCT ACCGGGAACT GCTGGCGGAG 
AAAGGTAGCC CGCTCAGCTG A

Protein sequence

MKVLHVEGGR NLYGGARQVL YLLEGLEQRG IDNVLVCPAG SELAREAAAH AEVHAIPMSG 
DLDFRLIGRL YRIIGRVRPD LAHLHSRIGA DVMGGIAARL AGVPVVHSRR QDNPEMRWAV 
AVKYRLHDRV VAISEGIARV LASEGLPAAK LRVVRSAIDP APFLQPGDRP GFRTEFGLPE 
DCTVIGVIAQ LIERKGHRFL LEALPELTGR YPGLHVLLFG KGPLESSLIE TVRHLGLADR 
VHFAGFRDDL PRILPCLDLV VHPALREGLG ISLLQAAAAG VPIVASRAGG IPEAVRDGDN 
GLLVPPGDAA ALAAAIRRLL DDRDLARDMG QRGRALIGRE FSVEGMVEGN LAVYRELLAE 
KGSPLS