Gene GM21_0019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0019
Symbol
ID	8135318
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	26549
End bp	27586
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	62%
IMG OID	644867636
Product	Cytochrome-c peroxidase
Protein accession	YP_003019864
Protein GI	253698675
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	85
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCGA AATGGTTCAT ACTGCTCTTG CCGCTGCTTC CCGGATGCGT CGATGCCACC 
GCCAAGGAAA CCATGTCCAA GGCCCAGGCC ACCTTCAAGC CCATCCCGGC GCAGGCACCA 
GCCATCAAGG GGAACGAGGC GACCAAGGCC AAGGTCGACT TGGGCAAGAA ACTCTTCTTC 
GATCCCCGTC TCTCCACCTC GCAACTCATC AGCTGCAACA CCTGCCATGA CGTAGGCCTC 
GGGGGCGCCG ACCTCCAGGA AACCTCCGTC GGCCATGGGT GGCAGAGAGG CCCCCGCAAC 
GCCCCTACCG TTTTCAACGC CGTCTACAAC GTCGCCCAGT TCTGGGACGG CAGGGCCAAG 
GACCTGCAGA CCCAGGCCAA GGGGCCGGTG CAGGCGTCCG TGGAGATGAA CAGCAACCCC 
GAGCTGGTGG TGAGAACCCT GAAGAGCATC CCGGGATACC CAGCTCTCTT CGAGGCGGCC 
TTCCCCGGGT ACAGCGATCC AGTCACCTTC GACAACATGG CGAAGGCGAT TGAGGTGTTC 
GAGGCGACAC TGGTGACTCC GGATGCCCCG TTCGACCGCT TCCTCAACGG AGAGGCCAGC 
GCTCTAAGCG CGCGGGAACA GGCTGGTTTG GGTGTCTTCA TGGAGAAGGG TTGCGCCGCC 
TGCCACGGGG GAATCAACAT CGGCGGTGCC GCCTACTACC CCTTCGGCGT CCGTGAGGTC 
CCGGCTGCAG AGATCCGCCC CGAGAGCGAC ACGGGTCGTT TCAAGGTGAC CAATACCGCC 
AGCGACAAGT ACGTTTTCCG GGCGCCGTCG CTCAGGAACG TCGCGATCAC CCAGCCTTAT 
TTCCATTCCG GAAAGGTGTG GAGCCTCAGG GAGTCGGTGG TGGTGATGGG GTCCGCGCAA 
CTGGGAATGA AACTGAACGA GACGGAAGTG AACGACACGG TCGCATTCAT GAAGAGCCTG 
ACGGGAAGAC AGCCGAATAT GGATTACCCC CTGCTTCCGC CGAGTTCGGA CCAGACCCCG 
CATCCGCAGC TAAAGTGA

Protein sequence

MKAKWFILLL PLLPGCVDAT AKETMSKAQA TFKPIPAQAP AIKGNEATKA KVDLGKKLFF 
DPRLSTSQLI SCNTCHDVGL GGADLQETSV GHGWQRGPRN APTVFNAVYN VAQFWDGRAK 
DLQTQAKGPV QASVEMNSNP ELVVRTLKSI PGYPALFEAA FPGYSDPVTF DNMAKAIEVF 
EATLVTPDAP FDRFLNGEAS ALSAREQAGL GVFMEKGCAA CHGGINIGGA AYYPFGVREV 
PAAEIRPESD TGRFKVTNTA SDKYVFRAPS LRNVAITQPY FHSGKVWSLR ESVVVMGSAQ 
LGMKLNETEV NDTVAFMKSL TGRQPNMDYP LLPPSSDQTP HPQLK