Gene Cmaq_1351 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_1351
Symbol
ID	5710270
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	1428256
End bp	1429344
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	44%
IMG OID	641275858
Product	glycosyl transferase family protein
Protein accession	YP_001541167
Protein GI	159041915
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGATAC AATTACTCTA CATGGGTTTA CTCCTAGTAC TGATACACGT TGCGGTACCG 
TTAATTTACT ACATTATTAT CCTAACCTAC GCTAGGAGGC CTTGGTTAAT TAACTCAATT 
AACGTTAATG ATGGTGAATT ACCCGCGGTA TCCATCATAA TACCTACATA TAATGAGGAG 
AACATGATAC TGGGGAAGCT GGATAATATT CTTGAACAGA ATTACCCCCT GGATAAGATC 
CAGTTAATAA TATCCGACTC AAGCAGTGAC AATACTCAGG TTAAGGTTGA GGAGTGGTTG 
AGTAGGCATA GGGGAGTTAA CTTAAGTTAC ATTAAGGGCC CCAGGATGGG TAAGGGCCAT 
GCATTAAATA AGGCGTTGGA GGCTGCGTCG GGTAGTATTA TAGTGACCAC TGATGCTGAT 
TCACTTTGGG TTAAGGACTC ATTAATTAAC GCCGTTAAGT GGCTTAGTAA TGAGCAGGTG 
GGTTTGGTTT CATGCGTAAA GGTACCTAGG GGTGGTGGAT CAACTGAGGA TGCCTATAGG 
AGGCTTTACA ATACCTTGAG GATTGGGGAA AGTAAGATAC ACTCCACTGT TGTTTTCCAC 
GGTGAATTAC TGGCTGTTAA GGGGGATTTA ATTAGGAGTA TTGGTGGTTT TCCAACGGAT 
ATTGGTGCAG ATGACTCATA TACGGGAGTT AGGGTTGCCT CAATGGGTCT TAGAGCCGTG 
ATTCCGGAGA ACGTGGTTTG CATGGAGTAT GTTCCAAGTA ATGGGTATAG TAGGTGGAGG 
GTTAGGAGGG CTCAACACCT ATTGCAGAGC TTCATGAAGT CAATTAAGTT ACCTAAACCA 
AGCAATTATA AACCAATCTA CTACACTGAA GCCTACATTC ACCTAATGAA CCCATGGCTA 
CTCCCAATTG GCGCAATCCT GCTCCTAGCC TCAGGGAGCC TGTGGGCATA CGCCTTAATT 
GCAGTGGGTT TAGTATTATT AGTGTGGTCA CCCTTCAGGG CTTGGGTAAC GCAGCAATTC 
ATACTGATGT ACGCCATGGT CAGGAACCTG TGGACTAAGG AATTAATGTG GGAGAAGATT 
AGTAAATAA

Protein sequence

MLIQLLYMGL LLVLIHVAVP LIYYIIILTY ARRPWLINSI NVNDGELPAV SIIIPTYNEE 
NMILGKLDNI LEQNYPLDKI QLIISDSSSD NTQVKVEEWL SRHRGVNLSY IKGPRMGKGH 
ALNKALEAAS GSIIVTTDAD SLWVKDSLIN AVKWLSNEQV GLVSCVKVPR GGGSTEDAYR 
RLYNTLRIGE SKIHSTVVFH GELLAVKGDL IRSIGGFPTD IGADDSYTGV RVASMGLRAV 
IPENVVCMEY VPSNGYSRWR VRRAQHLLQS FMKSIKLPKP SNYKPIYYTE AYIHLMNPWL 
LPIGAILLLA SGSLWAYALI AVGLVLLVWS PFRAWVTQQF ILMYAMVRNL WTKELMWEKI 
SK