Gene GM21_3040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3040
Symbol
ID	8138386
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	3529928
End bp	3531331
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	63%
IMG OID	644870641
Product	cytochrome c oxidase subunit I
Protein accession	YP_003022827
Protein GI	253701638
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG3278] Cbb3-type cytochrome oxidase, subunit 1
TIGRFAM ID	[TIGR00780] cytochrome c oxidase, cbb3-type, subunit I

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	163
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCAAC AAGAAGGGTA CGCGGACGAC GTCGTCAAGG GGTTCATCAC CTGGAGCATG 
GTGTGGGGTC TCGTGGCGGT CCTGGTCGGC GTGCTGATCT CGTTCCAGAT CGCATTCCCG 
CAGTTGAACC TCCCCCCCTA CCTCACCTAC GGCAGGCTGC GCCCGATCCA CACCAACGCC 
GGGATCTTCG GCTGGGGGAT CGGCAGCTTC ATGGCCTTTT TCTACTACAT CACCCAGCGC 
CTCACCCGTA CCGGCATCTG GAGCCCGGGG CTGGCGCGGG TCCAGCTCTG GCTCTTCAAC 
CTGGCCATAG CCCTCGCCGC GGTGACGCTG GCCCTCGGCA TGAACCGCTC CAAGGAGTAC 
GCCGAGTTGG AGTGGCCGGT GGCGAGCCTC GTGGTGGTGG TCTGGGTCAT CTTCGCGGTC 
AACATCATCA TGACCATCGT GAAGCGCCGC GAGGAGCAGA TGTACATCTC GCTTTGGTAC 
ATCCTGGCCA CCCTGGTCGG CGTCGCGGTG CTCTACCTGG TGAACAACGC CTCCATTCCC 
GTGTCGCTCA CCAAGTCCTA CTCCGCCTAC GCGGGGGCCA ACGACGCCAA CGTCCAGTGG 
TGGTACGGCC ACAACGCGGT CGCCATGGTG CTCACCACTC CCCCCCTGGC CATCTTCTAC 
TACTTCCTCC CCAAGGCGAC CGGGGTCCCC ATCTACAGCC ACCGCATGGG CGTGATCGCC 
TTCTGGAGCC TCATCTTCAT GTACCTTTGG ACCGGGGCGC ACCACCTGCT CTGGGCGCCG 
GTCCCCGACT GGGTGCAGAC CCTCGCCATG GGCTTCTCGG TGATGCTGAT CGCCCCCTCG 
TGGGCCGCGG TCTTCAACGG CTACTTCTCC ATGAACGGAC AGTGGCACCA GATGCGGGAG 
AACTACCTGG TCAAGTTCCT CATCTTCGGC ATCACCTTCT ACGGAACCCA GACGCTGCAG 
GGGCCCTCGC AGTCGATCAG GACCTTCTCC GCCTTCATCC ATTTCACCGA CTGGGTCCCG 
GGGCACGTGC ACATGGGGAC GCTCGGGTGG GTCTCCCTGG TCCTCTTCGC CGCGATCTAC 
TACACCGTCC CCCGCATCTA CGGCACCGAG ATCTACTCGA TCCGCCTGGC GAACATCCAT 
TTCTGGCTGG TGCTCACCGG GCAGCTCATG TTCTCCATCA GCATGTGGAT CGCCGGCGTG 
CAGCAGGCGG CGATGCTGAA CGCGACCAAC CCGGACGGAA GCCTCCACTA CAGCTTCATG 
GAGACCATGA TCGAGATCTA TCCCTACTGG CACATAAGGG CACTGGGCGG GGTGGTGTAT 
CTCGCCGGCC TCAGCGTGTT CCTCTACAAC ATCTGGAAGA CCGTCGCCGG CGCTAAGACG 
CAGGGCGCGG AGCAGACGGC TTAG

Protein sequence

MNQQEGYADD VVKGFITWSM VWGLVAVLVG VLISFQIAFP QLNLPPYLTY GRLRPIHTNA 
GIFGWGIGSF MAFFYYITQR LTRTGIWSPG LARVQLWLFN LAIALAAVTL ALGMNRSKEY 
AELEWPVASL VVVVWVIFAV NIIMTIVKRR EEQMYISLWY ILATLVGVAV LYLVNNASIP 
VSLTKSYSAY AGANDANVQW WYGHNAVAMV LTTPPLAIFY YFLPKATGVP IYSHRMGVIA 
FWSLIFMYLW TGAHHLLWAP VPDWVQTLAM GFSVMLIAPS WAAVFNGYFS MNGQWHQMRE 
NYLVKFLIFG ITFYGTQTLQ GPSQSIRTFS AFIHFTDWVP GHVHMGTLGW VSLVLFAAIY 
YTVPRIYGTE IYSIRLANIH FWLVLTGQLM FSISMWIAGV QQAAMLNATN PDGSLHYSFM 
ETMIEIYPYW HIRALGGVVY LAGLSVFLYN IWKTVAGAKT QGAEQTA