Gene GM21_3814 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3814
Symbol
ID	8139188
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	4385029
End bp	4386876
Gene Length	1848 bp
Protein Length	615 aa
Translation table	11
GC content	66%
IMG OID	644871433
Product	TPR repeat-containing protein
Protein accession	YP_003023591
Protein GI	253702402
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG4235] Cytochrome c biogenesis factor
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	97
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAGC TAGTAACCCG TCCCAGCGGC GCTGTCGCGG TCCTGCAAGA AGGGGCGCTT 
CTTTCCGCCA TCCTGATCAC CAGCAACAGG GAATCGCACC TCAGGGAATG CCTGTGCGAA 
CTGATGCAGC AGAGCATCTC CGACCGCATG GAGGTGATCG TGGTCGATCA GGGGTCGGAG 
CAGTGCGAAT GGGCCGTGGT GGCCGACCTG CAGAAGATCC ACCCGAACCT GATCTCCCTG 
AAGCTTCCGG CGGCCGCCGG CGGCAAGGGG GTCGAGATGG CGCTCAGAAT CGCCTCGGGC 
AAGTACGCGA CACTTTTGGA GGCGACCGAC CGCTTGAAGC GCGACGCCTA TGGACTCTTG 
ACCGCGGCCC TGGAGGGAAA CCCCGCCGCG ATGCTCGCCT ACGGCGACAC CTGCTTCACC 
GCCATCCCCC ACGAGAGCTT CGCCAGCCAC ACGAGCTACG GCAAGGTGAT CTGGCCCGAT 
TACACCCCCC AGCAGCTGGC CCAGCTCTCC GAGGTGGCCC CGCACCCGGT CTGGCGCAGG 
GAACTGCACG ACAGCGTCGG TTTCCCGCCG CAGGGGTGCC CGAACCACGG GGTGCGCGAG 
TTCATGCTCA AGGTGGTGGA GCGCTTCCGC ATCCTGCACC TGGAGGAGTT CACCGGCCTC 
AAGCTGATCA CCGCAAACCA GGCGCCGGTC CAGGCGGCTC AACCGCAGGC GCGCCCCGAG 
CCCGCCCCGG CGGTCCATCG CGCTCCCGAG CAGGAACCCG CCCCCCCCGC CACCCCCGTC 
AGCTTCGAAC AGCCGAGCGC GCCCGCAGCA CCGGTTTACA GCCAGAGCGC GCCGGCGCCC 
TCGGTCCAAG CCGTGCCGCG GCAGAAAACG GCGAACTCCG AACTGAAAGG GGCGGACCAG 
GTGTACCAGG AACTGCGCCC CATCGTCACA GGAGAAGACC CGCAGCGGGC CGCGGCGGCG 
CTCCGTGAGC ACCTGGCGCG TTTTCCCAAG CACGCCGTGG CCCACAACGA CCTGGCAGCC 
ATCAGCTATC AACTGGGCGA AAAGGAACAG GCGCTCAAGC ATTACCGCGA GGCGGTCTGG 
CTCGATCCTA AAGAAAACGT CTACCTGAAG AACCTGGCCG ACATCCTTTT CGTCGAGGCG 
GGAGAGGCCG ACGAGGCGAT AGCGATCTAT CTGAGGCTCC TGGAGCAGTC GCCGCGCGAC 
GTCGAGACCC TGCTGAACCT CGGGATCATC TGCGAGAGCG TGGGGCAGCC CGCCGAGGCC 
GAATCCTTCT ACCAGAGGGC GCTGGAGATC GAGCCTTGGA ACCAGGCCGC ACGGCAGCAA 
CTGACCGCGC TGCGCCAGAG GACGGAAGAG CCCCAGCCCC CGGCTGCAAA AGACGAGGAT 
CTCGCCGCAG AGGATCGGTA CCAGAGGTCC CAGGAACTGG TCTCCCAGGG GGACCTGGAC 
GGGGCGTTCC AGGAACTGAA AGAAATCCTC CTCTCTTACC CCGACTTTGC CCCCGCGCAC 
AACGACCTGG CCGTTTTGGC CTACCAGCAG GGGGACAAGG AGCAGGCGCG CGCGCACTAC 
GAGAAGGCGG CGGAGCTTGC GCCTGGAAAC GGCACCTTCC AGAAGAACCT GGCCGACTTC 
TACTTCGTCG AAGGGTACGA CGTCGACGGG GCCATCGCGA TCTACCTGGA ACAGCTCCGC 
AGGGAGCCCA AGAACATCGA GACGCTGATG GGGCTTGGGA AGATCTGCAC CATACTGGAC 
CGCCCGGTAG AGGCGCAGAG CTTCTACGGC AAGGTGATCA ACCTGGAGCC GTGGAACCGC 
GACGCCCGCG AATGCCTCAA CAGCCTGAAG GAGGTGGCGA ACGGCTGA

Protein sequence

MSQLVTRPSG AVAVLQEGAL LSAILITSNR ESHLRECLCE LMQQSISDRM EVIVVDQGSE 
QCEWAVVADL QKIHPNLISL KLPAAAGGKG VEMALRIASG KYATLLEATD RLKRDAYGLL 
TAALEGNPAA MLAYGDTCFT AIPHESFASH TSYGKVIWPD YTPQQLAQLS EVAPHPVWRR 
ELHDSVGFPP QGCPNHGVRE FMLKVVERFR ILHLEEFTGL KLITANQAPV QAAQPQARPE 
PAPAVHRAPE QEPAPPATPV SFEQPSAPAA PVYSQSAPAP SVQAVPRQKT ANSELKGADQ 
VYQELRPIVT GEDPQRAAAA LREHLARFPK HAVAHNDLAA ISYQLGEKEQ ALKHYREAVW 
LDPKENVYLK NLADILFVEA GEADEAIAIY LRLLEQSPRD VETLLNLGII CESVGQPAEA 
ESFYQRALEI EPWNQAARQQ LTALRQRTEE PQPPAAKDED LAAEDRYQRS QELVSQGDLD 
GAFQELKEIL LSYPDFAPAH NDLAVLAYQQ GDKEQARAHY EKAAELAPGN GTFQKNLADF 
YFVEGYDVDG AIAIYLEQLR REPKNIETLM GLGKICTILD RPVEAQSFYG KVINLEPWNR 
DARECLNSLK EVANG