Gene GM21_1194 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1194
Symbol
ID	8136519
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	1388929
End bp	1390404
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	62%
IMG OID	644868808
Product	cytochrome c family protein
Protein accession	YP_003021013
Protein GI	253699824
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	124
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAAGA AAACGATTAA ATTGCTGGTA GCGGCCGCGG CCATGCTCGT GAGCGCTTCA 
CTCGCCTTCG CGACACCGCC TCCGGCTCCC CAGACCGTAG GGATCAAGGA CACGGTCTTC 
AAGAACTTCT CTGGTTCGAA CTACAAGCTC TGCCGCGACT GCCACACCCC CGGCTGGGTC 
ACCGCGACCG ACAGCGACCT GGTCCTGAAG GACAAGCACC ATGCGTTGAT CAACCAGCCC 
GGCGGCGTTG TGGTCAGCTG CAACAACGCC TCCGGCACCC TTCCTGCCAA TCTGGCTACC 
GGATGCCATT ACATCACCAC CGATCCGGCC ACCGGCGTCA CCGCAGTCCA GGATCCAAGG 
CCCTGCTTCA ACTGCCATAC CAAAGGTCCG CACCACTTGA CCGACCAGGC GGCAGCGCAA 
AACTGCAAAT ACTGCCACGG CTCTGCCATC GACAACCCGG GTGACGGCCA CTGGATCCCG 
ACCAGCACCG ACTACGCGAT GGATACGACC TTCAACGGCA TGACCCCTGC TCCGGTAGGC 
CGCAGTGTCG TGGATCCCGC CGACCCGACC AAGACCATAA TCGTTCAGGG TTGCGAGGCC 
TGCCACCAGG CCGACACCAC CCTTCAGATA TTCGCCAACA AAGACACCCA CCACAGCACC 
GGTATCGGCC AAGACCTCAG CCCGGTCGGT AACTGCACCT GGTGCCATGC CGCGACCGGC 
AGCGAAAACA ACTTCACCAT CCGCGCCTGC GAGGCCTGCC ACGGCATCGC CTCTTTGCAC 
AACATCCAGG CCGACTCCCC GAATGCCGCA AACCTTGGGA CCATCGTTGC CAGCAACGAG 
GAGCCGGGCT TTGGTCACGT CGGTAACAAC TGGGATTGCG TGGGCTGCCA CTACTCCTGG 
ACCGGCACCG CCGTAAGCGA TACCACCGCT ACCGCGCCGT TTGTAAACGA GATCAGCGCC 
ATCACCCTGC CGGCAGGCGT CGCCAACACC CTTACCCTCA CCGGTATGGG CTTCACCAAC 
CTGGATGCCA CCGGGAACAA CTACATCCCG ACCGTGGTCC TGACCCGCGG AACTGAAACC 
TTCAACCTGA TTCCGTTCTC CACCTCGGTG AGCGAAATCA AGGTTGCTCT CCCCACGACC 
CTGGTTGCTG GCGTGTACGA AGTCCGCGTC AACAAGGGCG GCGAGACGGT CAGTAACCTG 
AAGAGCCTTA CCCTCACGCC GAGACTTGCC GCCACCAACG CGCTCTTGAC CTCCACCACC 
CTTACCATCA CCGGTACCGG GTTCAGCACC GCTCCGGCCA ATGAGTACCA GGGCCTTATG 
GGTGTCTTCG TCGACGGCGT CCAGGCTCGG GTCATTTCCT GGAGCAACAC CAAGATCGTC 
GCCACCGGCA CCAACTTCGC CGCCGGCAAA CTTGCCGTCG TGAAGTCCGT CTACGGGGAC 
GTGACCCGTC CCATCACGGT ACCGATCAAG AAGTAA

Protein sequence

MEKKTIKLLV AAAAMLVSAS LAFATPPPAP QTVGIKDTVF KNFSGSNYKL CRDCHTPGWV 
TATDSDLVLK DKHHALINQP GGVVVSCNNA SGTLPANLAT GCHYITTDPA TGVTAVQDPR 
PCFNCHTKGP HHLTDQAAAQ NCKYCHGSAI DNPGDGHWIP TSTDYAMDTT FNGMTPAPVG 
RSVVDPADPT KTIIVQGCEA CHQADTTLQI FANKDTHHST GIGQDLSPVG NCTWCHAATG 
SENNFTIRAC EACHGIASLH NIQADSPNAA NLGTIVASNE EPGFGHVGNN WDCVGCHYSW 
TGTAVSDTTA TAPFVNEISA ITLPAGVANT LTLTGMGFTN LDATGNNYIP TVVLTRGTET 
FNLIPFSTSV SEIKVALPTT LVAGVYEVRV NKGGETVSNL KSLTLTPRLA ATNALLTSTT 
LTITGTGFST APANEYQGLM GVFVDGVQAR VISWSNTKIV ATGTNFAAGK LAVVKSVYGD 
VTRPITVPIK K