Gene GM21_3064 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3064
Symbol
ID	8138410
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	3553839
End bp	3555047
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	60%
IMG OID	644870664
Product	hypothetical protein
Protein accession	YP_003022850
Protein GI	253701661
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	0.161492
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCTTTA ATCCTTTCAA AGAGCGCGGC ATCGCCGCCG ACAAGCAGCT GAGGAACTGG 
CAGGAGTTGA ACGTCAAACC TTACGACAAG AACGAGGCGC ATCCCTACAC GAAGGCCCGC 
ATCATCCTCA TGAACGGCGT GGAGGTCGAG GGGGCCATCT TCTCGCACCA GTTCGCCCGA 
AACTGCAACG ACCCGGAACT AAAGAAGCAG TTAGCCCTCA CCCGCAGGGT CGAACAGCAG 
CAGCAAAAAA CCATCAACTG GCTTTCCCCG GGCGACGAGT CGCCGCTTGA GACCACCATC 
GGCTACGAGC AGGTGGCGGT CGATCTCACC GCCTTTCTCG CCGCAAACGT CCCCGATCAG 
TACGTGAAGC AGGTCTTCGA TTTCGGGCTT CTGGAGGACT TCGACCACCT GTACCGCTAT 
GCCAACCTCC TGGAGATGAC GCAGGGGGTG ATGGCTGAGA AGCTGGTCGG GAAGCTGACC 
GAGATCACCC CTGGGCGCCC CACCATCAAG GAGCACCGCC ACCCCTTCGA CGATGTCAGG 
AAGCCGATGA ACCGTTTGGC CGCCGATCCG CTCACCAAGC TCTACACGCT CACCCTTTTG 
GCAGGCGAGC AGCAGACCAT GAACTTCTAC ATGAACATCG GCAACACGCT GCAGGACCAG 
GTCGGGCGGG GGTTGTACCA GGAGATCGCC ATGATCGAGG AGCAGCACGT CACCCAGTAC 
GAGTCGCTGC TCGACCCGCA GACCCCGTGG ATCGAGAACG CGCTCCTGCA CGAGTACAAC 
GAGTGCTGGC TCTACTGGTC CTTCCTGCAG GAAGAGACCG ACCGCCACGT GAAACCGATC 
TGGGAACTGC ACCTGGGCAT GGAGCTCACC CACCTCCAGA ACTTGGGCAA TGTCGCCGGC 
AAGATGGGGG TGAACGTGGA TCAGGTGCTG CCGCAGACCT TCCCCGCGCC GCTGCAGTTC 
AAGTCCCAGG TGAACTACGT CAGGGAGATC CTGGCCACCC AGGTCGACTA CAACGCCTTC 
GAGACCGAGA TCGGTCAGCC GGACCAACTC CCGGAAAACC CGCGCTACCT CGAGTGCCAG 
GACCTGCTCA ACGCAAAGGG GGCCCCGAGC GAAGAGGTGA TCAAGATGAA CCGGCGCAAG 
AATGGGCAGG ATTACCGCCT GGAGTTGGCG GGGCAGCATC CCGTAAAGGA ACTGCGTCAG 
AAGAAATAG

Protein sequence

MSFNPFKERG IAADKQLRNW QELNVKPYDK NEAHPYTKAR IILMNGVEVE GAIFSHQFAR 
NCNDPELKKQ LALTRRVEQQ QQKTINWLSP GDESPLETTI GYEQVAVDLT AFLAANVPDQ 
YVKQVFDFGL LEDFDHLYRY ANLLEMTQGV MAEKLVGKLT EITPGRPTIK EHRHPFDDVR 
KPMNRLAADP LTKLYTLTLL AGEQQTMNFY MNIGNTLQDQ VGRGLYQEIA MIEEQHVTQY 
ESLLDPQTPW IENALLHEYN ECWLYWSFLQ EETDRHVKPI WELHLGMELT HLQNLGNVAG 
KMGVNVDQVL PQTFPAPLQF KSQVNYVREI LATQVDYNAF ETEIGQPDQL PENPRYLECQ 
DLLNAKGAPS EEVIKMNRRK NGQDYRLELA GQHPVKELRQ KK