Gene Cmaq_0539 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_0539
Symbol
ID	5709802
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	+
Start bp	572734
End bp	573864
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	47%
IMG OID	641275043
Product	radical SAM domain-containing protein
Protein accession	YP_001540373
Protein GI	159041121
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1180] Pyruvate-formate lyase-activating enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.00688869
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.395603
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGGAGG CTGAGCTACA GCGCAACTTA AGTGGAGGAG TAGTAATGTG TACTGCATGT 
GCTAGGCGGT GTAGGCTTAA TGATGGACAA GTAGGATTCT GTGGAGTTAG GGCTAACTTC 
GGTGGTAGAT TATTCCTTGT TGTTTACGGT AAATTATCAG CCATAGCTGT TGATCCAATT 
GAGAAGAAGC CCCTCTTCCA CTTTAACCCA GGCTCAAGCG TCTTATCAAT GTCCACCTAC 
GGCTGCTCCT GGGCCTGTCA ATTCTGCCAA AACTTCGATA TTAGTCAAAG ACGCCTATGG 
GAGGGTTTCG AGGTGACGCC TGAGCTTATT ATTGAATTAG CTGAGAGTTA CGGGGTACAG 
GGCTTAACCT ATACTTACAA TGAACCCTCA GTCTTCGCCG AGTTCGCGCA TGACGTTGGC 
TTATTAGCTA AGAAGAAGGG ATTATTCAAC ACATTCGTCA CCAACGGTTA CTTAACTGAT 
GAGACTGTGG ACTACTTATC AAAGTTCCTT GACGCAGCCA CGGTTGACAT TAAGGGTAAT 
GCGAATAAGG AGTTCCTGAG GAAGTACTCA ATGGTTCCTG ACCCTGAGCC AATATTCCAA 
TCGATCAAGG AGATGAGGGA TAAGGGGATT CACGTGGAGA TAACTGACTT AGTTGTCCCA 
GAGATTGGGG ATAGGCTGGA GGACGCTGAG GTAATGCTTA AGAGAATCAT GGATTACCTA 
GGACCCGACG TATCAATACA CTTCCTCAGA TTCCACCCAG ACTACAAGCT CAGTAACCTA 
CCTCCAACAC CTGTTAAGAC TCTTGAGAAG CATGCTGAGT TAGCGAGGAG GATGGGGTTC 
AGGTACGTTT ACCTAGGTAA TGTCCCCGGG CATAAGCTTG AGAACACCTA CTGCCCTAAC 
TGCGGTAACG TGGTTATCAG GAGGTATGGA TTCCAGATAC TTGAGGTTAA CTTAACTGAG 
GATAATAGGT GCAGGTTCTG TGGGGCTAAG ATCAACATTG ATGGTAAAGT TTGGCCAACG 
TGGAGGGAGG ATAGATTCGC CTACGTCCCA ATCCACTTAT TCACAAAGTA CACTAAGGTT 
ACTAAATCAG ACGTGGAGGC TATTAGAGGT AGGTTAAGGC AGGGTGAGTA G

Protein sequence

MKEAELQRNL SGGVVMCTAC ARRCRLNDGQ VGFCGVRANF GGRLFLVVYG KLSAIAVDPI 
EKKPLFHFNP GSSVLSMSTY GCSWACQFCQ NFDISQRRLW EGFEVTPELI IELAESYGVQ 
GLTYTYNEPS VFAEFAHDVG LLAKKKGLFN TFVTNGYLTD ETVDYLSKFL DAATVDIKGN 
ANKEFLRKYS MVPDPEPIFQ SIKEMRDKGI HVEITDLVVP EIGDRLEDAE VMLKRIMDYL 
GPDVSIHFLR FHPDYKLSNL PPTPVKTLEK HAELARRMGF RYVYLGNVPG HKLENTYCPN 
CGNVVIRRYG FQILEVNLTE DNRCRFCGAK INIDGKVWPT WREDRFAYVP IHLFTKYTKV 
TKSDVEAIRG RLRQGE