Gene GM21_0488 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0488
Symbol
ID	8135797
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	600822
End bp	601958
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	65%
IMG OID	644868106
Product	protein of unknown function DUF362
Protein accession	YP_003020326
Protein GI	253699137
COG category	[S] Function unknown
COG ID	[COG2006] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.00000000573223
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTACCAGG TCGCGGTAGA GAAGGTCGGG GATTACCGGC GGGAGCCGGT CCAGGAAGGG 
GTGGCGCGGC TTCTGGCCAG GCTCGGGGGG ATGGAGCGCT TCGTGAAGCC CGGCGAGCGG 
GTGCTGATCA AGCCGAACCT CCTTTCCGCG AAGCCCCCCG AGGCCGCCGT CACCACGCAC 
CCGGAGCTGT TGCGGGCCGT GATCCTGCAG GTGCAGCAGG CGGGGGGGAT AGCGCTCGTC 
GGGGACTCCC CGGGGATAGG GAGTGCCGTA AAGGTCGCTA GACGCTCGGG GATGCTGGCG 
GTGATCGAGG AAACCGGGGC CGAATTCGTC CCCTTCGTGG AGAGCCGCGA GGTCGCAGGC 
TCCGGGGTTT ACCGCCGTTT CGAGCTGGCA GCCCCCTACC TGGAGGCGGA GCGCCTGATC 
AACCTCCCCA AGCTGAAGAC CCACGAGATG ATGACCATGA CCTGCTGCGT CAAGAACCTC 
TTCGGCGCCA TAGTGGGGAC GCAGAAGGCG GCCTGGCACC TGAAGGCCGG GGCGGACAAG 
GATCTATTCG CCCGGATGCT GTTGGAGGTG TACCGGTTGC GCGAGCCGGA TTTGAATATC 
GTGGACGCCA TCGTAGGGAT GGAGGGAAAC GGCCCGGGAA GCGGCGACCC CTGCCAGGTA 
GGTCTCCTTT TGGCAGGGGA TAACGCCCTC GCGGTGGACC AGGTGGCCGC GGAGATCGCC 
GGCATCCCCA AAAAGCTCCT CTACGTGGAA AACGCCGCGC GTCGGATGAA GCTTCCCGGA 
GCCGAGCGTG CGGAGGTCGA GTACCTGGGG CTTAATTCTA ATGAAGTCCC TTTCCGGAGC 
TTCCGGCTCC CCCATCTGTC AGACGTCCAG TTCGGACTCC CCGGCTTCTT GAAGCATCGG 
CTGCGAAACC AGTTGACCTC CCGCCCCGAG GTGGTGGACG GTGCGTGCCG GCTCTGCGAA 
ATCTGCGTCA GGGCTTGTCC TCCGGGCGCG ATCTGGGTGG AGGGGGGGAG GCTGCGCTTC 
GATTACCGGC GCTGCATCCG CTGTTTTTGC TGCCGCGAAC TCTGTCCGCA CGCGGCGCTT 
AGGCTCAAGG ACGGCTGGCT TCTTTCGCTA ATAAAAAAAA GTGGCACACC CCTTTAA

Protein sequence

MYQVAVEKVG DYRREPVQEG VARLLARLGG MERFVKPGER VLIKPNLLSA KPPEAAVTTH 
PELLRAVILQ VQQAGGIALV GDSPGIGSAV KVARRSGMLA VIEETGAEFV PFVESREVAG 
SGVYRRFELA APYLEAERLI NLPKLKTHEM MTMTCCVKNL FGAIVGTQKA AWHLKAGADK 
DLFARMLLEV YRLREPDLNI VDAIVGMEGN GPGSGDPCQV GLLLAGDNAL AVDQVAAEIA 
GIPKKLLYVE NAARRMKLPG AERAEVEYLG LNSNEVPFRS FRLPHLSDVQ FGLPGFLKHR 
LRNQLTSRPE VVDGACRLCE ICVRACPPGA IWVEGGRLRF DYRRCIRCFC CRELCPHAAL 
RLKDGWLLSL IKKSGTPL