Gene GM21_0891 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0891
Symbol
ID	8136212
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	1062381
End bp	1064045
Gene Length	1665 bp
Protein Length	554 aa
Translation table	11
GC content	59%
IMG OID	644868507
Product	hypothetical protein
Protein accession	YP_003020716
Protein GI	253699527
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	6.93749e-28
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGGCTAA AAATGCTCCT TTTCCTCATC CTTGTTCCGG TGCTGGTAGC CGGTTGCGGC 
GGCGGCTCCA ACCAGAGCGG GACCGCGATC TCGAAACTTG CGGCGTCGCA GGGTTGCGTG 
AGCCAGGACT GCCACGCCAC CTGGACCTCT CCGGGGTCAG GGGCCGTCAT TGCAGAGGAA 
TGGCGCGCTT CCGCCCATAA CTTAAAGAAC GGGGCGGGAT GTGCCGACTG TCACGAGCCC 
CACGCTGGGC ATCCGCAGTC CTGCTCCAAA TGCCACGGCG GCGGAAGCGG AGTAGCAATC 
AGGAACCCCG ATGGTGCCGG CAAGTGCGGC AAGTGCCACG GGCTCTCCTA CCCGGGCGAC 
GTCATGGTGG CGCAGGCGCC GCAGCACTTC GGCAACATTT CGGCGAGCGA ACTCAACACG 
AAGTATAGGG CCTCGTACGT CAGCTCCCGT AATGTGAACA ACTGTAGGAA CTGTCACAAC 
CCGCACAACC CGAGCGGCGC CATCACCATA GCGCGACAGT GGGCGCAAAG CGCGCACGGC 
AATACCAAGG CCAAGGCTTA TGCGTACTAC GACTTCAAGA CGATGGGCAG CGCACAGCCA 
TCATCAACCA CCTTCGAGTC GAACTGCGTC CGTTGCCACA CGACGACCGG CTATATTAAT 
TTTGTCAATT CAGGCTTCGT CGACATCCAC GCCTGGGGCA GCGGCAGCGA CAAGACGAAG 
GAAGTGACCG CCTGTAATGC CTGCCATGAT GACGGTGCCG GTCGCACCTA TGGCTACGGT 
CTGCGCAACG TCGCGGTCGT CAGCATTTAC TACAACTACT CCTCATCAAA GAGTTCTCCA 
ACGGTGAAGC TCAATAACAA CAAAACCTTG TACCCTGATG CAGGCGCATC CAACCTCTGC 
ATGCCTTGCC ACACAGGCAG GGCTGTCGGA CAGATGATTA AGGACGCGGC TGCGCTTGGA 
CTTAACTTTG CCAACGTCAA CATGCCGAAC GGCCATTACC GGTCCGCGGG GGCAACCGTT 
TTTCAACTGG GGGGCTACGA GTTCGTCGGG AGAAGCTACT CCAACGCCTC CTTCCTTCAC 
TCTTCAATCG GCCTTGGCAA CAACCGCGGC ACCGGCGGCA AAGGCCCCTG CATCACCTGC 
CACATGACCA ACGGCACCTC GCACCTTTTC ATGCCGGTGA CACTGGATGA TGTCAAGGCC 
GTCACCGGGG TGGTAAGCGC GACCTGCGTC AAGTGCCACG ACAGCAGCTT CCAAACCAGC 
CACACGGCCG TTTCGCTGCA GGTTCGCAAG GCGGGGTATG GCGCAGCATT GGCCATGCTT 
AACATCATCA AAACCGGCAA GTCGACCAGC ACCGACTGGG ATACTTTCGA CCCAGGCAAC 
GGAGCCAACA CCATGGGGGC ATCTTTCAAC TACAACCTGC TTTCGAGTGA ACCGGGAGCC 
TACGCCCATA ACCCGCTCTA CACCAAGCGG CTCATCTACG ATTCCATCGA CTGGATCTCT 
AACGCGGGCA TGGACGACGA CGTGGCGGCC GCCATAAGTG CTGCGACACT TCCAGGCTCG 
ATAACCAATC CGATAACCAA GATCGCTTAT ACTCCGGCGG AGGTTGCAGG GTTGAAGAGT 
CTGGCCATCG CCTACCTTAG TGGAAGCGGC GGCGGGCGTC CCTAA

Protein sequence

MRLKMLLFLI LVPVLVAGCG GGSNQSGTAI SKLAASQGCV SQDCHATWTS PGSGAVIAEE 
WRASAHNLKN GAGCADCHEP HAGHPQSCSK CHGGGSGVAI RNPDGAGKCG KCHGLSYPGD 
VMVAQAPQHF GNISASELNT KYRASYVSSR NVNNCRNCHN PHNPSGAITI ARQWAQSAHG 
NTKAKAYAYY DFKTMGSAQP SSTTFESNCV RCHTTTGYIN FVNSGFVDIH AWGSGSDKTK 
EVTACNACHD DGAGRTYGYG LRNVAVVSIY YNYSSSKSSP TVKLNNNKTL YPDAGASNLC 
MPCHTGRAVG QMIKDAAALG LNFANVNMPN GHYRSAGATV FQLGGYEFVG RSYSNASFLH 
SSIGLGNNRG TGGKGPCITC HMTNGTSHLF MPVTLDDVKA VTGVVSATCV KCHDSSFQTS 
HTAVSLQVRK AGYGAALAML NIIKTGKSTS TDWDTFDPGN GANTMGASFN YNLLSSEPGA 
YAHNPLYTKR LIYDSIDWIS NAGMDDDVAA AISAATLPGS ITNPITKIAY TPAEVAGLKS 
LAIAYLSGSG GGRP