Gene Cmaq_0444 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_0444
Symbol
ID	5709653
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	478736
End bp	479899
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	44%
IMG OID	641274947
Product	glycosyl transferase group 1
Protein accession	YP_001540279
Protein GI	159041027
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.990869
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGGTAC TTCATCTTTC CTGGGAGTAC CCACCACACA TAGTTGGTGG CTTAGGTAGG 
CACGTGTACT ACATAACCCA TGAGCTCATT AAACTGGGTG TTAATATTGA TGTAGCCACT 
GTGGGTTATG AAGACACCCA CGTTATTGAT GAGGGTGTTA ACGTGCATTT AATCGACGCA 
TTCAAGGTTA GGGTACCTGA CTTCTCATCA TGGGTTCACT CCTTCAACAT ATTCATGATG 
ATGGATTTAA GCCACATAAG TGAGGTTGAT GCAATTCACG TTCACGACTG GTTAACTGCA 
CCGGCAGGTA TTGTGCTTAA GCATAGGTTT AAGATACCCT TAATAGCCAC AATACACGCC 
ACGGAATACG GCAGGAGGGG TGGATTGCAT AGCCTTGAGT CCAAGCATAT TCATGAGTGG 
GAGTGGTTAC TTGCCTATGA GGCATGGAAG ATCATAGTCT GCAGCAACTA CATGGCCAAT 
GAGGTGAAGA GCGTCTTCGG TGTGCCTGAT GATAAAATAG TTATGATACC TAACGGCATA 
GATAAGGCGC TACTCAGCTT TAAGCCTAAG TACGACCGCT CCAGGTACGC TTACCCCTGG 
GAATTACTAA TAGTGTTCTA CGGTAGGTTA GTTTACGAGA AGGGTCCTGA CTCTGTGATT 
AGGGCTTTCG CCAAGTTAAT GAGCAGGATG AGTAACATTA AACTCGTAAT AATTGGTGAT 
GGGCCGATGA GGGAGTACTT AGTTAACCTG GCTAATCAAC TTGGGTTAGG TAGTAAGGTT 
TACTTCACAG GTAAGGTGAG TGACGATGAG TTATACAGCA TAATAGCTCA CTCAAATCTA 
GTCATATTGC CAAGTAGATA TGAGCCATTC GGTATAAGTG CACTTGAGGC CATGGCGCTT 
GGTAAACCAT TAATAGCAAC TAATAGGGGT GGGCCAACGG ACTTCATTAG ACATATGGAG 
AATGGGGTAT TAATCAACCC AGATAACCCT GATGAAATAG CCTACTACGC CGAGATGCTG 
CTTAAGGATG AGGGCTTAGC CCGTAGGTTA GCTAATGAGG CTAGGGGAAC GATAATGAAG 
GGGTACACTT GGGATATTAT AGCTAAGAAA ACTTATGAAC TCTATAAAAC AATAATTGAG 
GAGAGGGCTA AGGTTAATTG GTAA

Protein sequence

MRVLHLSWEY PPHIVGGLGR HVYYITHELI KLGVNIDVAT VGYEDTHVID EGVNVHLIDA 
FKVRVPDFSS WVHSFNIFMM MDLSHISEVD AIHVHDWLTA PAGIVLKHRF KIPLIATIHA 
TEYGRRGGLH SLESKHIHEW EWLLAYEAWK IIVCSNYMAN EVKSVFGVPD DKIVMIPNGI 
DKALLSFKPK YDRSRYAYPW ELLIVFYGRL VYEKGPDSVI RAFAKLMSRM SNIKLVIIGD 
GPMREYLVNL ANQLGLGSKV YFTGKVSDDE LYSIIAHSNL VILPSRYEPF GISALEAMAL 
GKPLIATNRG GPTDFIRHME NGVLINPDNP DEIAYYAEML LKDEGLARRL ANEARGTIMK 
GYTWDIIAKK TYELYKTIIE ERAKVNW