Gene GM21_3013 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3013
Symbol
ID	8138359
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3501095
End bp	3502123
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	63%
IMG OID	644870614
Product	cytochrome d ubiquinol oxidase, subunit II
Protein accession	YP_003022800
Protein GI	253701611
COG category	[C] Energy production and conversion
COG ID	[COG1294] Cytochrome bd-type quinol oxidase, subunit 2
TIGRFAM ID	[TIGR00203] cytochrome d oxidase, subunit II (cydB)

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	100
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCTGC ATATCGTTTG GTTTGTGCTT TGGGGTGTTC TGTGGGGGGT CTATTTCATG 
CTGGACGGGT TCGTGCTGGG AGGGGGCATG CTGCACCGCG TGCTCGGCAG AGACGATACC 
GACCGGCGCG TGCTCATCAA CGGCTACGGC CCTGTCTGGG ACGGCAACGA GGTCTGGCTG 
GTCACCGCCG GGGGCGCCAC CTTCGCCGCC TTCCCGACCA CCTATGCGCT CATGTTCAGC 
TACCTGTACA CCCCGTTGTT GCTGCTTCTT TTCGCGCTCA TCGTGCGCGG GGTCTCCTTC 
GAGTTCCGCG GCAAGGAAGA CGGCGCGCTC TGGAAGGGGT GCTGGGACTG GGCCATAGTC 
ATCTCCAGCT TCATCCCGGC GCTTCTTTTT GGTGTCGCCT TCGGCAACAT CTTCGCCGGT 
CTCCCCATGG ACGAGGCGGG CTACCACGGC TCTCTCATCT ACTTGTTGAA TCCCTACGGC 
GTGGTGAGCG GCCTTCTCTT CGTATTGCTC TTCCTGGAGC ACGGCGCGCT CTACGCGGCC 
CTGAAGAGCA CCGGCGCCCT GAGCCGTCGC GCCGAAGAGA TGGCGAAGGC GCTCTGGATT 
CCGCTTCTGG TGGTGGCGGT GGGCTTTTTG GGCTACAGCA ATTTCGCAAC GAAGCTCTAC 
GACAACTACC TCGCCGCACC CGTCTTCGCC GTGGTGCCGC TGCTGGCCGT GGCCGCGCTC 
TTGGCGGTGC GCCTGTTCCT TGCCAAGGGG AACCCCCTGG CGGCTTTCGC GGCGTCCTGC 
GCCACCATAC TGGGGGTTGT TTTCACCGGC GTCATCGGGC TCTTCCCGAA TCTGATCCCC 
TCGAACCTCG ACGCGCTTTA CAGCCTCACC ATATACAACA GCTCCTCCTC CGATTACACG 
CTGCGCATCA TGACCGTCGT CGCCTTCATC TTCGTGCCGA TCGTGATCGC CTACAAGATC 
TGGGTCTACC GGCTCTTCCG GGGGCGGGTC AGCGCCGAGA CCCTGGCCGG GGACCACGAG 
GCTTACTAG

Protein sequence

MDLHIVWFVL WGVLWGVYFM LDGFVLGGGM LHRVLGRDDT DRRVLINGYG PVWDGNEVWL 
VTAGGATFAA FPTTYALMFS YLYTPLLLLL FALIVRGVSF EFRGKEDGAL WKGCWDWAIV 
ISSFIPALLF GVAFGNIFAG LPMDEAGYHG SLIYLLNPYG VVSGLLFVLL FLEHGALYAA 
LKSTGALSRR AEEMAKALWI PLLVVAVGFL GYSNFATKLY DNYLAAPVFA VVPLLAVAAL 
LAVRLFLAKG NPLAAFAASC ATILGVVFTG VIGLFPNLIP SNLDALYSLT IYNSSSSDYT 
LRIMTVVAFI FVPIVIAYKI WVYRLFRGRV SAETLAGDHE AY