Gene GM21_3163 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3163
Symbol
ID	8138515
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3674220
End bp	3675548
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	62%
IMG OID	644870768
Product	cytochrome C family protein
Protein accession	YP_003022948
Protein GI	253701759
COG category
COG ID
TIGRFAM ID	[TIGR01905] doubled CXXCH domain

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	121
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAAAGT TCGGCTTAAT GACTATCTTT TCCCTGAGCG CGCTGCTTAC GGCATGGTCG 
CCGGCTTTCG CCGACAGTTG CCTTACCGCA GGGTGCCACC AGCCGATATC GGGAATGAAA 
GCGCAGCATG ACCCGGTCAA GGGAGGCGAC TGTCTTTCCT GCCATGTCAG CCAATCGGCG 
AACCACCCCA CCCCCGGGGC GAAAGGGTTC AAGCTCACCG CCTCCGGCGC CGCCCTCTGC 
AGCCAGTGCC ACACCCCTTA CGGGAAGAAG AAGACAGTGC ATGCGCCGGT CAAGGAGGGT 
GAGTGCACCG CCTGCCACAA CCCGCATGGC GCCGACGGCC GCTACCTCAT CAACGCTAGC 
GACGACCAGA CCGGGCTCTG CATGGCATGC CACGATTCCG CCATGATCAA GCACAAATAC 
ATGCACGGCC CCGTAGCGGT GGGCGCCTGC ACCAAATGCC ACGATCCGCA CGAGTCCAAC 
GGCAAGGGCC TGATCAAAGG GAGCGTGCGC GAAAGCTGCC TCGGCTGCCA TGCCGACTTT 
GCCGCCTCCT TCCAGACCGC ACAGGTGGTG CACCCGCCGG TCAAAAACGA TCCCTGCACC 
CTTTGCCACG ATCCTCATGG CTCTGCCGTT CCCTTCATGC TCAGCAAGAA GATGCCGGAT 
CTCTGCATCG GCTGCCACAG CGGGCTGGCG AAGAAACTCA CCGCCAAGGT CACCCACAAG 
CCGCTGCTGC AGGAGGCCGG GTGCGGCAGT TGCCACTCCG CCCACTTCGC CAAGGCCAAG 
GGGCTTCTCC CCTTCGACGA GGTGACTACC TGCCTCTCCT GTCACGACAA GGACAACCTC 
GGCAAGCCGG CTCTGCGCAA CATCAAGAAG GAGATGGCCG GCAAGAAGTA CCTGCACGGT 
CCGGTCGCAA AGGGGGAGTG CAAGGCCTGC CACGACCCGC ACGGCTCCGA CAACTTCCGT 
CTGCTCAAAG GGGCATACCC GTCGACACTG TACGTGCCGT ACCAGGAAGG GATCTACGAT 
GCCTGCCTCA ACTGCCACGA GAAGAACCTG CTCCGTTTCG CGGACACCAC GATCTATACC 
AACTTCAGGA ACGGGAACCG GAACCTCCAC TACGTCCATG TGGTTAACAA CCGCAAAGGG 
CGTAGCTGCC GCATCTGCCA CGACGTCCAC GCAAGCGACG GCCAGAAGTT GATCACCAAG 
ACCGGGGCCA AGTTCGGAGA CTGGAAGATT CCGACCAACT TCAAAATGAC CGAAACCGGA 
GGGAGTTGCG CTCCGGGATG CCACCGCGAA CTCTCGTACG ACCGCAAGAG CGCGGTGTCT 
TACAAGTGA

Protein sequence

MRKFGLMTIF SLSALLTAWS PAFADSCLTA GCHQPISGMK AQHDPVKGGD CLSCHVSQSA 
NHPTPGAKGF KLTASGAALC SQCHTPYGKK KTVHAPVKEG ECTACHNPHG ADGRYLINAS 
DDQTGLCMAC HDSAMIKHKY MHGPVAVGAC TKCHDPHESN GKGLIKGSVR ESCLGCHADF 
AASFQTAQVV HPPVKNDPCT LCHDPHGSAV PFMLSKKMPD LCIGCHSGLA KKLTAKVTHK 
PLLQEAGCGS CHSAHFAKAK GLLPFDEVTT CLSCHDKDNL GKPALRNIKK EMAGKKYLHG 
PVAKGECKAC HDPHGSDNFR LLKGAYPSTL YVPYQEGIYD ACLNCHEKNL LRFADTTIYT 
NFRNGNRNLH YVHVVNNRKG RSCRICHDVH ASDGQKLITK TGAKFGDWKI PTNFKMTETG 
GSCAPGCHRE LSYDRKSAVS YK