Gene Cmaq_1010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_1010
Symbol
ID	5709406
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	+
Start bp	1060214
End bp	1061362
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	48%
IMG OID	641275511
Product	hypothetical protein
Protein accession	YP_001540831
Protein GI	159041579
COG category	[C] Energy production and conversion
COG ID	[COG1139] Uncharacterized conserved protein containing a ferredoxin-like domain
TIGRFAM ID	[TIGR00273] iron-sulfur cluster-binding protein

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.12516
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGTATG ATGAGGCAAT TAGGAGGGCT GTGGAGGCTA ATGTGCCTAG AACCATGAGT 
ATTCTCGATA AGTACCCATA CGTAACCGAG TTGGCTAAGG AGCTTAGGAA GGCTAAGGAG 
GAGGTTATCA GAAACCTGGA GTACTACGTG GATAAGGCTA TGAAATCCAT TCAAGCCATA 
GGGGCTAAGG CGTACTTCGC AAGGGATGGC GATGAAGCCA GGAGAATAAT AGGTAATATT 
GTGGGTAAGG GTAATGTTAT AGTCTTAGGT AAGACAATGG TTGGCAGTGA GATTGGGCTT 
AGGGAATACT TAATCAGCAT TGGTAATGAG GTTTGGGAAA CCGACTTAGG TGAATTCCTA 
ATACAGTTAA CCGGGGATAA GCCAACCCAC ATAGTTGCCC CAGCCCTACA CATGACCAGG 
GAGAGGGCTG CCAGGGTTAT TAAAGAGAAG TTAGGCATAG ATGTTAAGGC CGATCCATCT 
GAAATAGCCC AGACAGCTAG AAGATTCCTG AGGGATAAGT TCTTTAAGGC TAACTTTGGG 
ATAACCGGAG CAAACGCAGT GGCCGCCGAC ACTGGGGCTG TGCTGCTTAT TGAGAATGAG 
GGTAACATAA GGTTCACCAC AGTGTCACCG CCGGTTCACA TAGTCTTAAC AGGTATTGAT 
AAGATAGTCC CAACACTGCA TCACGCATTC ATGGAGGTTA TGGTTCAAAG CGCCTACGCT 
GGACTCTACC CCCCAACTTA CGTTAACCTA GTGGCTGGAC CATCAACAAC AGCTGATGTT 
GAGCAGACTA GGGTTTCCCC CTCACACGGG CCCAGGGAGG TTCACGTAAT CCTCCTCGAT 
AATGGTAGGT TAAGGGCCTC TAAGGATGAT TTACTTTGGG AAGCACTACT GTGCATTAGA 
TGCGGTAGAT GCCACTTCCA TTGCCCAGTC TACAGGGCTT TAGATGGTTC ATGGGGTGAG 
TCACCCTACG TGGGGCCAAT GGGGGTTATG TGGACTGCTG TGGTTTATGG AATTGAGAAG 
GCTGGTCCAC ACGCAATGTT ATGCATGCAT GCTGGTACAT GCCGTGAAGC ATGCCCAATG 
AAGATCAACA TCCCTGAAGT AATACAGGGT ATTAAGGCAA GGTACACTAA ACTAGTGGCT 
AAGCGGTAA

Protein sequence

MGYDEAIRRA VEANVPRTMS ILDKYPYVTE LAKELRKAKE EVIRNLEYYV DKAMKSIQAI 
GAKAYFARDG DEARRIIGNI VGKGNVIVLG KTMVGSEIGL REYLISIGNE VWETDLGEFL 
IQLTGDKPTH IVAPALHMTR ERAARVIKEK LGIDVKADPS EIAQTARRFL RDKFFKANFG 
ITGANAVAAD TGAVLLIENE GNIRFTTVSP PVHIVLTGID KIVPTLHHAF MEVMVQSAYA 
GLYPPTYVNL VAGPSTTADV EQTRVSPSHG PREVHVILLD NGRLRASKDD LLWEALLCIR 
CGRCHFHCPV YRALDGSWGE SPYVGPMGVM WTAVVYGIEK AGPHAMLCMH AGTCREACPM 
KINIPEVIQG IKARYTKLVA KR