Gene Cmaq_0619 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_0619
Symbol
ID	5710214
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	652231
End bp	653343
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	46%
IMG OID	641275121
Product	glycosyl transferase family protein
Protein accession	YP_001540450
Protein GI	159041198
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGATG CACCTGATGC ATCAATAATA GTACCAACAC TTAATGAAGC TGGTAACGTA 
GGTAGGCTTA TTGAGGAATT AGCCAGTAAC CTTAAGGGCA TTAACTATGA GGTGGTAATT 
GTTGATGATG GATCAACTGA TGGAACCGTT AAGGTTGCTG AGGAGACTGC TAAGAAGCTT 
GGGGTTAATC TTAAGGTTAT TGAGAGGGGT AGGAGACTTG GATTATCAAG CGCAGTGATT 
GATGGTGTAA AGGCCAGTAG AGGGGGTATT ATTGTTGTAA TGGATGCTGA TTTACAACAC 
CCACCATCAG TAGTGCCTAA GCTTATTGAG GCCGTTTCAA ACGGCGCTGA TTTAGCCGTC 
GCTTCTAGGT ACATTAATGG TGGCGGCATA GCAGGTGATT GGCCCCTCCT TAGGAGGATA 
ATAAGCCGTG GGGCAGTTAC CCTAGCCCAC ATACTAGTGC CCACAGCCAG GGATGTTAAG 
GACCCTGTCT CAGGCTTCTT CGCAGTGAAG AGGAGTGCCG TATGCATAGA TAAGCCCCAT 
GGTGACTACA AGATCCTCCT CGACATACTC GCCCTCTGTA GGGTTAGGAG GATAGTGGAG 
GTTCCCTACG TTTTTAGAAC CAGGGAGGCT GGCTCATCTA AGCTAGGTAC TAGGCAAATA 
ATAAACTACG TTAAGCAGAT TGCCTCAATA TCACTGAGTC TGCTTTCCCT AAGTGGTTAT 
AGGCCCATTA AATTCGCCAT TGTCGGCGCA ATAGGCCTAG TTGTCTCAGA ACTGGTGCTT 
CACGTATTCT GGAGGATACT TGGGTTAGCG TACTTCATAT CCCTCATACC AGCTATTGAG 
GCGGGTATTG CTAATAACTT CACCCTAAAT AAGGTGTGGA CGTTTAAAGA CAGGTCAGTG 
GGTTACTGGG TGGGGTTAGG TAAGTATCAT GTGGCTAGTT TAACCGGAAC AGCGGTGACG 
TATGCTGTAA CGAACCTGCT TCACTACGGC CTAGGCGTAA ATGGTTACGT AGCATACGTA 
ATAGGTGTTA TATTCGGTTT CATAGCCAAC TACATTATGG CCGAGGTCTA CGTCTTCAAA 
TACCGGCGCA CGGGCACTGA TAATAACCTT TAA

Protein sequence

MSDAPDASII VPTLNEAGNV GRLIEELASN LKGINYEVVI VDDGSTDGTV KVAEETAKKL 
GVNLKVIERG RRLGLSSAVI DGVKASRGGI IVVMDADLQH PPSVVPKLIE AVSNGADLAV 
ASRYINGGGI AGDWPLLRRI ISRGAVTLAH ILVPTARDVK DPVSGFFAVK RSAVCIDKPH 
GDYKILLDIL ALCRVRRIVE VPYVFRTREA GSSKLGTRQI INYVKQIASI SLSLLSLSGY 
RPIKFAIVGA IGLVVSELVL HVFWRILGLA YFISLIPAIE AGIANNFTLN KVWTFKDRSV 
GYWVGLGKYH VASLTGTAVT YAVTNLLHYG LGVNGYVAYV IGVIFGFIAN YIMAEVYVFK 
YRRTGTDNNL