Gene GM21_0101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0101
Symbol
ID	8135404
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	122683
End bp	123672
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	64%
IMG OID	644867721
Product	cytochrome C oxidase mono-heme subunit/FixO
Protein accession	YP_003019945
Protein GI	253698756
COG category	[C] Energy production and conversion
COG ID	[COG2993] Cbb3-type cytochrome oxidase, cytochrome c subunit
TIGRFAM ID	[TIGR00781] cytochrome c oxidase, cbb3-type, subunit II

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	0.000967148
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGATGA CCCCTGCCGT CCTCATCGTC GGCGCGCTGA TGGTCTTCTG GGCCTCCGCC 
TTCATCATCG TGGGAATACC CTCCCTCACC ATGAAGGAAA CCCCTTCCGA GATCTGGCGC 
CCGCTCTCCC CGCTGGAAAA GACCGGCCAC AGGCTCTACG TCAAAAACGG CTGCAGCTAC 
TGCCATTCGC TCTTCATCAG GGTGAACGAC TGGGACATAG GCGCCGAGCG GATCGCCAAG 
GCTGGCGACT ATGTCGGCGT CGAGCCCGCC ATCTTGGGCT CCGAGAGAAC CGGCCCGGAC 
CTCTCGCAGG AGGGGGGGGA GCACAGCGAC GACTGGAACA TCGCCCACTT CACCAACCCC 
CGCTTCACCA GCCCGATCTC GCTCATGCCC TCGTGGGATT TTCTGGAGGA AAGCGAGATA 
ACGGCCTTGA CCGCCTACGT CCAGGCGCAG GGGGGAAAGC ATGCGGACCT GCGTCAGGCC 
CGGCAGAGGG AGTGGAAAAA GCAGGCGGTG GCGGCCTACA GCGGCGGGTT CGACCGCAAC 
ATCGAGTGGC TGCACGCCCA GGTTCCCGAG GTCTGGCGGC GCATGCCGAA CCCGTACCCG 
GCAACGGAAG CCGCGCTCAC GCGGGGGAAG CGGATCTACC AGCAGCTCTG CGTCAACTGC 
CACTCCCCGG TCGGCGACGG CAACGGTCCG GCGATGCCCT TTCTGGCCCC CCCTCCGCTG 
AACTTCACCA CGCTGCGCCG GCACGTCGTC GAGAACAGGT ACATCGGGGG GATCTTCTAC 
TACCAGATCA TGAACGGGGT TACCGGGACC GCCATGCCCT ATTTCAAGAA GCACCTGGAG 
TCCGAGAAGA TCTGGGATCT GGCGAATTAC CTCGCCGTTT TCTTCGTGGG GTACACCGAC 
GCCAACATCG ACCCCCGCGG CATCGACGCC TCATTCGAGG GGGCGTGGGA GAACAGGTAT 
CCGCCTCCGC ATAAAGCTAC GGCGGACTAG

Protein sequence

MKMTPAVLIV GALMVFWASA FIIVGIPSLT MKETPSEIWR PLSPLEKTGH RLYVKNGCSY 
CHSLFIRVND WDIGAERIAK AGDYVGVEPA ILGSERTGPD LSQEGGEHSD DWNIAHFTNP 
RFTSPISLMP SWDFLEESEI TALTAYVQAQ GGKHADLRQA RQREWKKQAV AAYSGGFDRN 
IEWLHAQVPE VWRRMPNPYP ATEAALTRGK RIYQQLCVNC HSPVGDGNGP AMPFLAPPPL 
NFTTLRRHVV ENRYIGGIFY YQIMNGVTGT AMPYFKKHLE SEKIWDLANY LAVFFVGYTD 
ANIDPRGIDA SFEGAWENRY PPPHKATAD