Gene GM21_0104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0104
Symbol
ID	8135407
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	125642
End bp	126718
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	67%
IMG OID	644867724
Product	hypothetical protein
Protein accession	YP_003019948
Protein GI	253698759
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	0.00147272
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCCACAA GTGACCGCGG GCATGGCTCG AAGAGCTGGG GCGTCGCCTG GGGCGTTGCG 
GCCGTCGCCG GGATCGCGCT CTGGGCGGTC CTGCTCCGGG GGGATGACCC CGCGCGGGCC 
TGGCGCTCGC TCCTGGTCAA CTTCCTGTTC TTCAGCTCGC TTTCCGCCGG GCTCGTGGTC 
TGGCCGGCGC TGGTAAGGAC CTGCAACGGG AAATGGCAGC TGGGGGTGGA ACGCCACGCC 
AGCGCGGCAA TAGCCTTCGC CCTCCCCTCC CTCCTCGCCC TCGCCCTCCT CTGGGGGGGA 
AGCGGCGCCT GGGCGCCTTG GTACCGGGCG AACTTCCACC AGGGCCTTTG GTTGAACAAC 
AGCTTTCTCT TCGCGCGGGA CCTGGCGGCC CTCCTGTTGT TCTGGGGCTG GGCCGCGTTT 
CACCTGGCGC GGCGGCGCCA AGGGAACGGC AGGCGCTCGG GGGTCGTCCT CCTGGTGGTC 
TACGCCCTCA CCTTCTCCCT CTTGGGTTTC GACCTGGTGA TGGCGCTCGA TCCGCACTTT 
CACAGCAACC TGGCCGGCGG CTACTTCTTC ATGTCCGGGC TCTACATCGG CATCAGCGGC 
TGGGCCCTCA TCGCCTGCCT GAAGGGGGGG GCGAAGCCCA AGCAGTTGCA CGACCTGGGG 
AAGCTCATGC TCGCCTTCAG CCTGATGACC ACCTACCTCA TGTATGCGCA TCTGCTCCCC 
TTCTGGTACG AGAACCTCCC CCCGGAGATC CGTTTCCTGG TGCCGCGCAT GCACAACGAA 
AACTGGTCGC CGGTGAGCGT GCTGCTGCTC TGCACCGTCT ACTTCGGTCC GCTGGTGCTG 
CTCCTTCCCG CCCGCTTCAA GCAAAACCGC TATACGCTGG GCGCGGTAGC CCTCTTGGTC 
GTGGCCGGGA TGTGGCTTGA GCGCTGGTGG CTGGTGGCGC CGACCTTCGA CCCGCTGGCG 
AGGCTCGGCC TGAGCGAGCT ATCGCTCGCC TTAGGCTGTA CCGGGCTCCT CGGGCTGGGG 
ATGCTGATCA GCCCGCGCCA CCTGCCGAGC GATGCGCCGG AGGGGGATGA GCCGTGA

Protein sequence

MSTSDRGHGS KSWGVAWGVA AVAGIALWAV LLRGDDPARA WRSLLVNFLF FSSLSAGLVV 
WPALVRTCNG KWQLGVERHA SAAIAFALPS LLALALLWGG SGAWAPWYRA NFHQGLWLNN 
SFLFARDLAA LLLFWGWAAF HLARRRQGNG RRSGVVLLVV YALTFSLLGF DLVMALDPHF 
HSNLAGGYFF MSGLYIGISG WALIACLKGG AKPKQLHDLG KLMLAFSLMT TYLMYAHLLP 
FWYENLPPEI RFLVPRMHNE NWSPVSVLLL CTVYFGPLVL LLPARFKQNR YTLGAVALLV 
VAGMWLERWW LVAPTFDPLA RLGLSELSLA LGCTGLLGLG MLISPRHLPS DAPEGDEP