Gene GM21_3643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3643
Symbol
ID	8139017
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4220729
End bp	4221970
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	50%
IMG OID	644871264
Product	PDZ/DHR/GLGF domain protein
Protein accession	YP_003023422
Protein GI	253702233
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	166
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGTCT TCCAGTCTCG TCATCAGTCA CTGTTTTTAA TCTGTATTCT ACTGACCGGT 
TTGCTGACTG GCGGTTGCTC GACAATCAAG GGTATCTCAA TGATCCGGGG AGGTTCTCCC 
CAGAGCACCT TGGCTGGCGA CGAATCTGTA AAAGCAGAGC AGATGGCCCA TCTTCTGACC 
GTAAAGGTCA GGATCGATGA TGCACCAGAG GATCTGACTT TCATGGTGGA TACAGGTGCC 
ATTACCGTCA TAGATGAACA GATCGCCAAG AGATTGAAGT TCAAGGACTC GGTAACCAAT 
AAGGTTACAG ACTCAGCGGG GAACAAAAAA GACATCCGCC TGGTTCAGGT GAACAAAATA 
AGCGTCGGTA AAGTCGCAGT TTCAGATTGC GCTGCCGCGG TTGTCGATAT GAAAAAATTC 
AACCCCAAGA TAGACGGCCT GCTCGGCTCG AATTTCCTGA GGTTTTTCAC GGTTCAGCTG 
GATTACCGAA ATCACCGTGT GTCGTTCCTG AGTAAGTCGG ACGGGCGCTC CCTTGAGGGG 
GCGATGAAGT TGCCGATGTG GCAAAACATG AAGTTCGGAT TCGCACCTAC CATCAAATGC 
GAAGTAGACG GCTCGGTAGC TCTCGACTGC ATGGTCGATA CCGGACACGA TGCGATCGCC 
TCCTTTCCTC TCTCCATTCT CGACAAGCTC CCTCACTTCA AGACCGGAGA ATATATCAGC 
TCCAACGGCT CAATGGGAGC AGGAATATTT GGCAAAGACA CCCAAAGTTA CCTGGTCAGA 
ACGGATCGAA TAGCATCAGG TCCCATAACC ATAGAAAATG CGGCGATTGT CTCTAACCGG 
TTTGAAGATG TCATGACCCT TGGAGCCGCC TATCTGAAGA ACTTCCTGGT GACCATCGAT 
TATCCAGCCT CTTTGCTGTA CTTGAAGCAG TACGACGATC AGCATCTCGA AAAGGAGATG 
ATGTCCTACG GATTCGCCGT CTCCTATGAG AAGGATAAAG CGATCGTGAG CGGCCTATGG 
AGAGGGAGTG CCGCGGACAA AGCGGGAATA TCACTCGGTG ACGAGGTGAT TGCTTTGAAC 
GGCCATGAGA CATCGGGGTT GTCTTTATTC GACATGATGC AACTTGTGAA ATCGAACGAA 
ACCCTGAGCA TTTCCTATAT CAAAAGTTCC AACGGGACCA AGTCGGATTT AACCCTCCAT 
AAAGGGGACT TGACGCTCCT TCTACCGCCG TCGCCCAACT GA

Protein sequence

MDVFQSRHQS LFLICILLTG LLTGGCSTIK GISMIRGGSP QSTLAGDESV KAEQMAHLLT 
VKVRIDDAPE DLTFMVDTGA ITVIDEQIAK RLKFKDSVTN KVTDSAGNKK DIRLVQVNKI 
SVGKVAVSDC AAAVVDMKKF NPKIDGLLGS NFLRFFTVQL DYRNHRVSFL SKSDGRSLEG 
AMKLPMWQNM KFGFAPTIKC EVDGSVALDC MVDTGHDAIA SFPLSILDKL PHFKTGEYIS 
SNGSMGAGIF GKDTQSYLVR TDRIASGPIT IENAAIVSNR FEDVMTLGAA YLKNFLVTID 
YPASLLYLKQ YDDQHLEKEM MSYGFAVSYE KDKAIVSGLW RGSAADKAGI SLGDEVIALN 
GHETSGLSLF DMMQLVKSNE TLSISYIKSS NGTKSDLTLH KGDLTLLLPP SPN