Gene GM21_2202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2202
Symbol
ID	8137538
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	2572832
End bp	2573881
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	63%
IMG OID	644869817
Product	cytochrome bd ubiquinol oxidase subunit II
Protein accession	YP_003022012
Protein GI	253700823
COG category	[C] Energy production and conversion
COG ID	[COG1294] Cytochrome bd-type quinol oxidase, subunit 2
TIGRFAM ID	[TIGR00203] cytochrome d oxidase, subunit II (cydB)

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.0000000104234
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCTGATC CGGTAATTCT CGCCGCGATG GTCCTCGTTG CCGGCCTGCT CATGTACGCG 
CTCTTCGGCG GGGCCGACTT CGGCGGCGGC ATCTGGACCG CTCTCGCTTT CGGGCCGCGC 
GCGCGGGAGC AGAGGGAAGC GCTTTTCAAC GCCATCGGTC CTGTGTGGGA GACGAACCAC 
GTCTGGCTTA TCTTCGTTAT CGTCACCCTC TTCACCGCCT TTCCCGCCGG TTTCGGTAAC 
CTCTTCATTG TGCTGATGAC ACCTTTGGTG CTGGCCTTGG TGGGGATTAA CTTCAGGGGC 
GCCGCTTTTG CCTTCCGCCA TTTCGGCAGG GAACTGAAGA AGGAGACCCC GGTCAGCGCC 
CGCGTGTTCG AGATCGCCAG CGTGCTCACG CCGTTCACCC TGGGGCTTGC GGTATCCGCC 
ACTGCGGCCG GGAGGATCGT CATCGCCGGG CGCATGCCAA CCGAACAGTT TTCAGACTGG 
CTCAACTCCT TCACCCTTTT GGGGGGCGTG GTCGGCATGG CGATCTGCGC CTATCTGGCA 
CCCATTTATA TGACGGTGCG CGTCACGGGG GAGCTGCGGG AGGACTTCCG GAAGGAGTCG 
CTGGCGGCAG GGCTCGCCCT GGGCATTCTC ACCTCGCTGA TGATCCCGCT GGCGCACTAC 
CAGGCGCCGC TTTTCGCCGA GAGGCTGTTC AACTCGTGGC CCATGCTGTT CGTGATGCTG 
GCGATACTTG CCGGCGTCGT CACCGAGTCT TTGCTCTGGC TGCGGCGCTA TTTCTGGGCG 
CAGCTTATAG CCGGCGCTAC CATCGTCTTC ACCATGGCTG GCTTTGTCGC TGCGCTCAAC 
CCCGACATCC TGATCGGGCA ACTGACTCTG CGTGCCGCCG CGGCGCCGCA TCCGACCCTG 
GTCGCCTTTC TCGCCGTCCT GCCGATAGGG GCTTTGATCC TGGTCCCTTC GCTCGTTTAC 
CTGTACTGGA CTTTTCGGGG TGAGCCGTCT GCCGATATGC CGCCGGCTGG AAAGGCCGGG 
AGGGGAGGGG GACAGGGCGA GGAATCGTGA

Protein sequence

MADPVILAAM VLVAGLLMYA LFGGADFGGG IWTALAFGPR AREQREALFN AIGPVWETNH 
VWLIFVIVTL FTAFPAGFGN LFIVLMTPLV LALVGINFRG AAFAFRHFGR ELKKETPVSA 
RVFEIASVLT PFTLGLAVSA TAAGRIVIAG RMPTEQFSDW LNSFTLLGGV VGMAICAYLA 
PIYMTVRVTG ELREDFRKES LAAGLALGIL TSLMIPLAHY QAPLFAERLF NSWPMLFVML 
AILAGVVTES LLWLRRYFWA QLIAGATIVF TMAGFVAALN PDILIGQLTL RAAAAPHPTL 
VAFLAVLPIG ALILVPSLVY LYWTFRGEPS ADMPPAGKAG RGGGQGEES