Gene MCA1017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA1017
Symbol
ID	3103139
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	+
Start bp	1068621
End bp	1069607
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	67%
IMG OID	637170202
Product	nucleoside diphosphate sugar epimerase family protein
Protein accession	YP_113493
Protein GI	53804856
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.582194
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCACAC TGGTCACCGG CGCCACCGGC CATCTCGGCG CCAATCTGGT TCGGGCGCTG 
CTGGCCCGGG GCGAGAAGGT GCGCGCCTTC ATCCGCCGAC AAAGTGACGT CGCGGCGTTG 
GACGGCTTGG CGGTCGAACG GGCCTACGGC GATCTGCGCG ACCGCCGCTC GATCCGGGAC 
GCGCTGGAAG GCGTGGAGCG GTTGTACCAC ACCGCGGCCT TCGTCAGTAT CCGCGACGGT 
GACCGCCAGG AGCTGTTCGA CGTCAACGTG GTCGGCACTC GCATGCTGAT GCAGGAGGCG 
CGGCGGGCCG GCGTGCGTCG GGTGGTGCAT ACCAGCTCCT TCGGCGCGGT CGGCATCAAC 
CCCCAAGGCG CATCGAACGA ACACTGGACA GTCAGCCCGT TCGAACCGGG CACCGACTAC 
GAACGGACCA AGGCCGTGTC GGAACACGAC GTGATCCTCG AAGCCGTGCG CGGCCTCGAC 
GTGACCATCG TCAACCCGGC CGCGATCGTC GGTCCGTGGG ATTTCCGGCC CAGCCTGGTC 
GGCCGTACCA TCCTCGACTT CGCCCATGGC CGGATGAGGG CGTTCGTTCC CGGTGCCTTC 
GACTTCGTCC CGATGCGCGA CGTGGTGGCT GTGGAACTGC TGGCCATGGA CAAAGGCATC 
CGCGGTGAGC GCTATCTCGT CACCGGCGAG CACTGCACCA TCGGTCAGAT ACTGCAATGG 
CTGGAGGAGC TGACCGGGCA TCCGCGTCCG AGGCTCGCGA TCCCGCCGCG CCTCATGCAG 
GGCATCGCAC TGCTGAAGGA CCCGCTGGAA CGCCGTTTTT TCCCCCGCCG GACGCCACGC 
TTCAACTACC ACTCCATCCG CCTGCTCAAC TCGGGCAAGC GCGGCGATTC CTCACGGAGC 
CGGCGCGAAC TGGGCCTGGT CCCGACTTCC ACCCGGGCGG CTTTCGCCGA CGCCGTGGCC 
TGGTTCAGGG AGAGGGGGAT GATCTGA

Protein sequence

MTTLVTGATG HLGANLVRAL LARGEKVRAF IRRQSDVAAL DGLAVERAYG DLRDRRSIRD 
ALEGVERLYH TAAFVSIRDG DRQELFDVNV VGTRMLMQEA RRAGVRRVVH TSSFGAVGIN 
PQGASNEHWT VSPFEPGTDY ERTKAVSEHD VILEAVRGLD VTIVNPAAIV GPWDFRPSLV 
GRTILDFAHG RMRAFVPGAF DFVPMRDVVA VELLAMDKGI RGERYLVTGE HCTIGQILQW 
LEELTGHPRP RLAIPPRLMQ GIALLKDPLE RRFFPRRTPR FNYHSIRLLN SGKRGDSSRS 
RRELGLVPTS TRAAFADAVA WFRERGMI