Gene Cmaq_0230 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_0230
Symbol
ID	5710137
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	264395
End bp	265783
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	43%
IMG OID	641274732
Product	glycoside hydrolase family protein
Protein accession	YP_001540068
Protein GI	159040816
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5434] Endopolygalacturonase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTAATT CTCTTCCCTC AGGTAGGACG TATAATGTTG TTGAGTATGG TGCTGATCCT 
AAGGGTTTGG ATGATAGTAC TGGGGCTATA AATGAAGCTA TTACCCAAGC CAGTGAGACT 
AGGGGTATTG TGTATATTCC TCCAGGCAAC TACTTATCAA GGAACATTAT TCTGAGGAGT 
AATGTAATGT TACTCATTGA TAAGGGTGCT GTGGTTAAAT TCTCAACCGA TTACAAGTCC 
TATCCAATAA TTGAGACTAG GAGAGAGGGG GTTCATCATT GTGGTGTTAT GCCGTTAATA 
TTCGGTAAGG ATGTTAGGAA TGTTAGGATT ATTGGGGAGG GTGTGTTTGA TGGCCAGGGT 
TACGCATGGT GGCCTATTAG GAGGTTTCGC GTTACTGAGG ATTACTGGAG GAGGCTTGTT 
GAATCAGGGG GTGTTGTTGG TGATGATGGT AAAACCTGGT GGCCTACTAG GAATGCCATG 
GAGGGTGCTG AGGCCTTCAG GAAAATAACC AGTGAAGGTG GGAAGCCGAG TACTGAGGAT 
TGTGAGAGGT ATAGGGAGTT CTTTAGGCCT CAGCTTCTTC AACTCTATAA TGCTGAGAAC 
GTGACCATAG AAGGGGTTAC GTTTAAGGAC TCACCCATGT GGACAATACA CATTCTCTAC 
TCAAGGCATG TTACATTAAT AAACACTAGT AGTATTGCCC CAGATTACTC ACCAAACACT 
GATGGTGTTG TCGTGGATTC CTCAAGTGAC GTTGAGGTAA GGGGCTGTAT GATTGATGTT 
GGTGATGATT GCTTAGTCAT AAAGTCTGGT AGGGATGAGG AGGGTAGGAG GATTGGCATA 
CCCTCAGAGA ATATTCACGC CTCAGGATGC TTAATGAAGA GGGGGCATGG TGGATTCGTT 
ATTGGTAGTG AAATGTCAGG TGGTGTTAGG AATGTTTCAA TTCAGGATAG TGTATTCGAT 
GGTACTGAGA GGGGTGTTAG GATTAAGACA ACTAGGGGTA GGGGTGGTTT AATTGAGAAT 
GTTTACGTAA ACAACATCTA CATGAGGAAC ATAATTCATG AGGCAGTGGT AGTGGATATG 
TTCTATGAGA AAAGGCCTGT TGAACCAGTA TCAGAGAGGA CGCCTAAGAT TAGGGGTGTG 
GTTATTAGGA ACACATCATG TGATGGGGCA GACCAGGCGG TGCTAATAAA TGGGTTACCT 
GAAATGCCCA TTGAAGACAT TATAATTGAG AATACTAGAA TAACATCAAA CAAGGGTATT 
CACATTGAAA ACGCCTCAAG TATTAGGCTC AGTAATGTTA AGGTGAACTC AAGGGCGATA 
CCAGTCATAA CCATGAGTAA CGTGAGAAAC ATAACGTTAG ACGACGTGAG CGGCTTATCC 
ATGGAGTAA

Protein sequence

MINSLPSGRT YNVVEYGADP KGLDDSTGAI NEAITQASET RGIVYIPPGN YLSRNIILRS 
NVMLLIDKGA VVKFSTDYKS YPIIETRREG VHHCGVMPLI FGKDVRNVRI IGEGVFDGQG 
YAWWPIRRFR VTEDYWRRLV ESGGVVGDDG KTWWPTRNAM EGAEAFRKIT SEGGKPSTED 
CERYREFFRP QLLQLYNAEN VTIEGVTFKD SPMWTIHILY SRHVTLINTS SIAPDYSPNT 
DGVVVDSSSD VEVRGCMIDV GDDCLVIKSG RDEEGRRIGI PSENIHASGC LMKRGHGGFV 
IGSEMSGGVR NVSIQDSVFD GTERGVRIKT TRGRGGLIEN VYVNNIYMRN IIHEAVVVDM 
FYEKRPVEPV SERTPKIRGV VIRNTSCDGA DQAVLINGLP EMPIEDIIIE NTRITSNKGI 
HIENASSIRL SNVKVNSRAI PVITMSNVRN ITLDDVSGLS ME