Gene Cmaq_0303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_0303
Symbol
ID	5708885
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	+
Start bp	342804
End bp	343889
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	45%
IMG OID	641274807
Product	NADH dehydrogenase subunit H
Protein accession	YP_001540141
Protein GI	159040889
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.594505
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTACC TAGAGCCCAT GGTGCAGATA CCGTTCCTGC AGCCGTTGAT TAACTTCCTA 
CTTAAGGTAC CTGTGATTGG GCCAATAGTT AACTTCCTAC TATGGACACC TATCTTCGCT 
GTTTGGTTCG TCCCTGGCCT CATTGGCTTA TTCATACCGC TAATATTTGT CATATGGTGG 
GAGAGGAAGG CTGCAGCAAG GGTTCAATGG AGGTATGGGC CACTTGAAAT ATCCAGGAGG 
ATTGGTGGTG TCATACAACC TATAAGTGAC TTAATAAGAT ACACGCTTCA GGAAATTATA 
ATTCACCAGG AGGCTGATGA AGCCTACTTC CTACACATGC CTGTCTTCGG CTTCATATTT 
GCACTACTAC CGGTCCTATT CCTACCCGCT GGGCCTCACG TATATGCAAT AAACACAGGC 
TACAACATAC TGATTGCAGC AGTACTCATA TCAATATTTA ACATCGTCAT AATAGTGAGT 
GGCTGGGCTT CAACGGATAA GTGGGCCTAC ATAGGTACTG TAAGGGAGGC GTTCATGTAC 
GCTGCCTATG AGGTACCATT CATGTTATCG GTAATAGCCA TGATAATACT ATTCGGTACA 
GCTGACCCAT TCGCAATGGT TAACGCCCAG GTAGCCCACT ACATACCTGG AGCCATACTT 
AACCCGATAG CCTTCATTGT AGCCTTCATA ACCACGGCAA TGGCCTCATC AAGGTTTCCA 
TTCACTATTG TTGAGAATGA TACTGATCTT GTTGTTGGAC CATTCACAGA GTACGGTGGC 
TTAATCTTCG GCTTAACAAT GACCATGAGT TACGAGAAAA CCTACGTGAT GACGCTGCTA 
CTCTCAATAC TCTTCCTAGG TGGCTGGAGC GGCCCATACA TTGGGCCATT GGGTGATTTA 
TCCGCACCAC TGTGGCTTGG TGTTAGGGTA TTCCTAGTCA TGATGTTCTT CTCATTCCTA 
AGGGCAGTTT ACCCCAGTTA CAGGCTTGAC CAAGCCTTAA GAATAGGATG GCGTACACTA 
CTTATTCTGT CAGTAGTAAG TGTTATATGG AGTATAGTTA TTAGGCTAGT GTTCCCGGTG 
ATTTAA

Protein sequence

MSYLEPMVQI PFLQPLINFL LKVPVIGPIV NFLLWTPIFA VWFVPGLIGL FIPLIFVIWW 
ERKAAARVQW RYGPLEISRR IGGVIQPISD LIRYTLQEII IHQEADEAYF LHMPVFGFIF 
ALLPVLFLPA GPHVYAINTG YNILIAAVLI SIFNIVIIVS GWASTDKWAY IGTVREAFMY 
AAYEVPFMLS VIAMIILFGT ADPFAMVNAQ VAHYIPGAIL NPIAFIVAFI TTAMASSRFP 
FTIVENDTDL VVGPFTEYGG LIFGLTMTMS YEKTYVMTLL LSILFLGGWS GPYIGPLGDL 
SAPLWLGVRV FLVMMFFSFL RAVYPSYRLD QALRIGWRTL LILSVVSVIW SIVIRLVFPV 
I