Gene GM21_2489 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2489
Symbol
ID	8137830
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	2912216
End bp	2913466
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	59%
IMG OID	644870098
Product	hypothetical protein
Protein accession	YP_003022289
Protein GI	253701100
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	111
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGAGGG GGATGGCACT GCTGACTTTT CTAGCCCTGG CTCCTGGTTT GGCGGCTTAC 
GCCCGTGCGG CGGATACCTC TTCGAGTTAC CGCACTCCGC TCGCAGGTGA GCCAGGCGAA 
GTTATGTTCA TGGGTGAGAA GGTTACTATC CCTCCCCTTG ATCGAAGCGA TATGACCTCC 
ATTACCCTCG GTGCATCTTT GCTTACCCCG CAACAGGGCG GGACCACTGC GCTCCCTGTG 
GCTGTTTTCT ACCATCGGCG TATCAAGGAC GACTACCGTG CCCGCTACAC GGTCAGCCTC 
TTCGTGAATG AACTGGAGTA CGACCGGAAC CTTGGGGGTG TTGAGCTGGT GACTCACTTC 
GAGAACTACA CCCTGCCGGT GCAGCAAAGC GAGATACTTG AAGGCCAGGA TATGAAGGGG 
ACCTCCCTTT ACTGGGGTAC CCTGCTCGGG TCGGTGGGGG CGGGATGGCG TATCCCGGTG 
CGCCCCCTGG AGGTGGACAA CGACCTGCGG TTGCAACTAT TGGGACGGGT TGGGTATTTC 
TATGCCAAAA CCGGCAAGGA TACCGCTGCC GACCTCTCGG TCCCGAACGA CACCATGCTC 
TATGGCGCCA GGGCTCGGGT GCACTATGAC ACCATGCGTC GCAACCTGCT GGAACTGCCG 
CACCAAGGGT TTGCCGTGGG TGGAGATCTG GATTTGATGC ATCGAGACAA GTGGAGTGAG 
CAATCTGCTA CGGCAACGCT GGGTGGAAAC CGGGATTACC TGCAGCTGAC CGGCTATCTT 
GCCGGGGCTG CGGGCATACC GGGGAGGTCG GAGCGGGACC GCCTGATTTA CTGTGCCTAT 
GCCGGTCATA CCTTCGACAA CAACGGAGAC AGGTTCAACG CCTTCCGCCT CAATGGAGCC 
TCTTTCCCGA GCGAGGCCGA CGATGTGGTC CGTCCTCACT ACACCGGCGT CATTTACGAC 
AACATCCCGG TAACCTCATA TGCAACGGTC TCAGCGGGTT ATCGCCGCGA GCTTACCTTC 
TTTCTTTACC TTAGCCTGTA CGGATCCTAC ATCTGGGCCG ACCGGGCCAC CGTGGAAGGG 
ACGAATCGGG TGGCCTTCCG GGACAAAGAA GGAGGCGCAG GGACCATCAC CCTAGATAGC 
GCCTTCTTGT GGGACTCATC CTTTTATCTG GCCTATACGT GGGAATCGGG TTTGATTCGA 
AACGGCCGGT CCGGGGGGGG GTACACCGTG ATGTGGAACA AGCTCTTCTA A

Protein sequence

MVRGMALLTF LALAPGLAAY ARAADTSSSY RTPLAGEPGE VMFMGEKVTI PPLDRSDMTS 
ITLGASLLTP QQGGTTALPV AVFYHRRIKD DYRARYTVSL FVNELEYDRN LGGVELVTHF 
ENYTLPVQQS EILEGQDMKG TSLYWGTLLG SVGAGWRIPV RPLEVDNDLR LQLLGRVGYF 
YAKTGKDTAA DLSVPNDTML YGARARVHYD TMRRNLLELP HQGFAVGGDL DLMHRDKWSE 
QSATATLGGN RDYLQLTGYL AGAAGIPGRS ERDRLIYCAY AGHTFDNNGD RFNAFRLNGA 
SFPSEADDVV RPHYTGVIYD NIPVTSYATV SAGYRRELTF FLYLSLYGSY IWADRATVEG 
TNRVAFRDKE GGAGTITLDS AFLWDSSFYL AYTWESGLIR NGRSGGGYTV MWNKLF